[leetcode] 182. Duplicate Emails

• data analysis/PYTHON

oujin 2024. 2. 16. 22:26

728x90

테이블 생성 코드

data = [[1, 'a@b.com'], [2, 'c@d.com'], [3, 'a@b.com']]

person = pd.DataFrame(data, columns=['id', 'email']).astype({'id':'Int64', 'email':'object'})

문제

해결 코드

import pandas as pd

def duplicate_emails(person: pd.DataFrame) -> pd.DataFrame:

results = person.loc[person.duplicated(subset=['email']), ['email']]

return results

풀이

results = 데이터프레임.loc[인덱스,['컬럼명']] 를 이용하였다,.

인덱스 = person.duplicated(subset=['email'])

duplicated(subset=['컬럼명']) 을 하면 해당 컬럼에서 중복값을 True로 알려준다.

duplicated(subset=['컬럼명'], keep='first')

keep='first' 는 기본값으로 중복값들 중에서 처음은 중복값이 아니라고 하는 것이다. 따라서 두번째 값부터 True가 된다.

728x90

오우진