• data analysis/PYTHON
[leetcode] 182. Duplicate Emails
oujin
2024. 2. 16. 22:26
728x90
테이블 생성 코드
data = [[1, 'a@b.com'], [2, 'c@d.com'], [3, 'a@b.com']]
person = pd.DataFrame(data, columns=['id', 'email']).astype({'id':'Int64', 'email':'object'})
문제

해결 코드
import pandas as pd
def duplicate_emails(person: pd.DataFrame) -> pd.DataFrame:
results = person.loc[person.duplicated(subset=['email']), ['email']]
return results
풀이
results = 데이터프레임.loc[인덱스,['컬럼명']] 를 이용하였다,.
인덱스 = person.duplicated(subset=['email'])
duplicated(subset=['컬럼명']) 을 하면 해당 컬럼에서 중복값을 True로 알려준다.
duplicated(subset=['컬럼명'], keep='first')
keep='first' 는 기본값으로 중복값들 중에서 처음은 중복값이 아니라고 하는 것이다. 따라서 두번째 값부터 True가 된다.
728x90