트위터의 이미지 크롭 알고리즘은 뭐가 문제였을까
트위터의 이미지 크롭 알고리즘을 둘러싼 인종차별 논란과 그 이후 트위터가 어떻게 대처했는지를 다룹니다. 자체 테스트와 알고리즘 편향 대회를 통해 발견된 내용들은 편리한 자동 크롭 기능이 어떤 의도치 않은 문제를 일으킬 수 있는지 보여줬습니다. 사건의 발단은 한 유저가 줌을 사용하면서 겪은 경험을 트위터에 공유하면서였습니다. 자신과 미팅을 한...
트위터의 이미지 크롭 알고리즘을 둘러싼 인종차별 논란과 그 이후 트위터가 어떻게 대처했는지를 다룹니다. 자체 테스트와 알고리즘 편향 대회를 통해 발견된 내용들은 편리한 자동 크롭 기능이 어떤 의도치 않은 문제를 일으킬 수 있는지 보여줬습니다. 사건의 발단은 한 유저가 줌을 사용하면서 겪은 경험을 트위터에 공유하면서였습니다. 자신과 미팅을 한...
밀도 기반 클러스터링 방식인 DBSCAN의 알고리즘과 장단점, 구현 방식을 들여다보는 글입니다. DBSCAN은 오늘의 주제인 DBSCAN(Density-Based Spatial Clustering of Application with Noise)은 무려 96년도 논문(A density-based algorithm for discovering...
파이썬 스킬 업을 보고 정리한 내용입니다. 백분율 기호 연산자(%)를 사용한 포매팅 다음과 같이 2가지로 사용 포맷_문자열 % 값 print('n is %d' % n) 포맷_문자열 % (여러_값들) print(...
파이썬 스킬 업을 보고 정리한 내용입니다. 커맨드 라인에서 파이썬 실행하기 IDLE이나 스크립트보다 빠르게 실행할 수 있음 맥의 터미널에서 python3 test.py doc string 작성하고 사용하기 주석을 작성하거나 무료 온라인 도움말을 가져올 때 활용할 수 있음 예를 들어 ...
파이썬 스킬 업을 보고 정리한 내용입니다. 1 - 필요하다면 코드를 여러 줄에 걸쳐서 작성한다. 물리적으로 1줄보다 더 긴 문장을 작성하려면? #줄-연장 문자인 역슬래시 기호 사용 my_str = 'I am Hen-er-y the Eigth,' \ ' I am!' #괄호를 사용해서 물리적으로 다음 줄을 자동으로 연결 my_str =...
파이썬 스킬 업을 보고 정리한 내용입니다. 리스트 생성 및 활용 생성: 대입 연산자를 통해 가능, 빈 리스트 생성 후 append로 하나씩 추가하는 것도 가능 / remove 메서드로 삭제 ($*$ 그 값이 존재하지 않으면 ValueError) 주의: remove는 여러 개의 값이 존재할 경우 가장 첫번째 순서만 지...
그래프 데이터베이스의 기본 개념들과 Neo4j를 간단히 소개하고, 샌드박스 DB를 만들어 Python으로 연결해봅니다. 그래프 데이터베이스란? 그래프 이론에 토대를 둔 일종의 NoSQL 데이터베이스입니다. 데이터의 연결관계 저장에 있어 RDBMS 대비 가장 큰 장점은 인덱스 없이도 빠르게 연결된 노드를 찾을 수 있다는 점입니다(index-f...
글또 6기 6개월 간 썼던 글들 👀 Label Propagation Algorithm 차별하지 않는 분류 모델 만들기 스파크는 내 코드를 어떻게 실행할까? 라벨은 없지만 이상치는 찾고 싶어 네트워크 분석이 알려주는 온라인 혐오 집단 대응법 스파크의 Adaptive Quer...
설명 가능한 이상치 탐지를 위해 Isolation Forest 모델을 적용하고, 그 결과를 SHAP으로 설명하는 방법을 알아봅니다. 각 방식의 개념과 간단한 파이썬 코드를 포함하고 있습니다. 오늘도 이상치 탐지(Anomaly detection) 이야기로 돌아왔습니다. 보통 이상치를 찾을 때 단변량(변수가 하나밖에 없는) 상황이라면 간단하게 ...
에러: OSError: [Errno 0] JVM DLL not found: /Library/Java/JavaVirtualMachines/jdk-15.0.2.jdk/Contents/Home/lib/libjli.dylib https://github.com/konlpy/konlpy/issues/353 zulu open jdk arm64용 15버전...