Blair  - Soul Eater [leetcode] 182. Duplicate Emails

• data analysis/PYTHON

[leetcode] 182. Duplicate Emails

oujin 2024. 2. 16. 22:26
728x90

테이블 생성 코드

data = [[1, 'a@b.com'], [2, 'c@d.com'], [3, 'a@b.com']]
person = pd.DataFrame(data, columns=['id', 'email']).astype({'id':'Int64', 'email':'object'})

 

문제

 

해결 코드

import pandas as pd

def duplicate_emails(person: pd.DataFrame) -> pd.DataFrame:
    results = person.loc[person.duplicated(subset=['email']), ['email']]
   
    return results

 

풀이

results   = 데이터프레임.loc[인덱스,['컬럼명']] 를 이용하였다,.

인덱스 = person.duplicated(subset=['email'])

duplicated(subset=['컬럼명']) 을 하면 해당 컬럼에서 중복값을 True로 알려준다.

duplicated(subset=['컬럼명'], keep='first') 

keep='first' 는 기본값으로 중복값들 중에서 처음은 중복값이 아니라고 하는 것이다. 따라서 두번째 값부터  True가 된다.

 

 

728x90