728x90
테이블 생성 코드
data = [[1, 'a@b.com'], [2, 'c@d.com'], [3, 'a@b.com']]
person = pd.DataFrame(data, columns=['id', 'email']).astype({'id':'Int64', 'email':'object'})
문제

해결 코드
import pandas as pd
def duplicate_emails(person: pd.DataFrame) -> pd.DataFrame:
results = person.loc[person.duplicated(subset=['email']), ['email']]
return results
풀이
results = 데이터프레임.loc[인덱스,['컬럼명']] 를 이용하였다,.
인덱스 = person.duplicated(subset=['email'])
duplicated(subset=['컬럼명']) 을 하면 해당 컬럼에서 중복값을 True로 알려준다.
duplicated(subset=['컬럼명'], keep='first')
keep='first' 는 기본값으로 중복값들 중에서 처음은 중복값이 아니라고 하는 것이다. 따라서 두번째 값부터 True가 된다.
728x90
'• data analysis > PYTHON' 카테고리의 다른 글
[leetcode] 620. Not Boring Movies (0) | 2024.02.19 |
---|---|
[leetcode] 175. Combine Two Tables (0) | 2024.02.16 |
* 조건에 부합하는 중고거래 댓글 조회하기 (1) | 2023.12.28 |
재구매가 일어난 상품과 회원 리스트 구하기 (0) | 2023.12.28 |
595. Big Countries (0) | 2023.12.28 |