Archives
- 10 Nov 라벨이 불균형하면 오버샘플링을 하라던데
- 16 Oct 6년차 데이터 어쩌구의 첫 이직 준비 후기와 팁
- 12 Oct 시계열 이상 탐지할 때 데이터 분포가 바뀐다면
- 12 May 글또 9기 끝
- 30 Mar Conformal Prediction으로 모델의 불확실성 계산하기
- 16 Mar 머신러닝 모델을 해석할 때 주의해야 할 8가지
- 03 Mar 옵시디언 사용기 (필수 플러그인, 블로그 글 쓰기, 해빗 트래커, 디지털 서재)
- 09 Feb 수학을 까먹은 사람을 위한 특이값분해(SVD)
- 21 Jan 스파크 UDTF(User-Defined Table Function)
- 07 Jan DTW로 시계열 클러스터링하기
- 31 Dec 수학을 까먹은 사람을 위한 고유값분해와 주성분분석(PCA)
- 19 Dec 슬랙 워크플로(workflow)로 팀 생산성 높이기
- 02 Dec 데이터와 모델만 있으면 끝인 건가? 에 대한 단상
- 12 Jul 글또 8기 회고
- 18 Jun AI의 존재론적 위협보다 중요한 것들에 대해
- 14 May 아직도 커널이 뭔지 모르겠어요
- 04 May 1년 간 데이터 분석가 채용에 참여하며 느낀 점
- 15 Apr GPT가 내 일자리를 뺏을 가능성은?
- 25 Mar 왜 딥러닝은 정형 데이터에 잘 안 통할까
- 12 Mar 기록이 나 대신 업무를 기억하게 하는 법
- 07 Feb Productionizing Airflow
- 07 Feb Airflow Deep Dive
- 07 Feb Airflow 소개
- 06 Feb Data Drift 발견하기
- 05 Feb 글또 8기 시작
- 09 Oct 글또 7기 회고
- 02 Oct LDA (잠재 디리클레 할당) 이해하기
- 18 Sep Subset Scanning으로 이상한 부분집합 찾기
- 04 Sep 그래프 DB - Cypher 기초
- 21 Aug 새로운 인풋을 찾는 데이터 분석가를 위한 뉴스레터 추천
- 22 Jul Attention은 설명인가 아닌가
- 10 Jul MLFlow Tracking 튜토리얼
- 08 Jun 스파크가 뭔지만 대충 아는 사람을 위한 RDD 설명
- 28 May 트위터의 이미지 크롭 알고리즘은 뭐가 문제였을까
- 07 May DBSCAN 이해하기
- 22 Jan [Python] 정밀한 텍스트 포맷팅
- 21 Jan [Python] 커맨드 라인과 패키지
- 21 Jan [Python] 22가지 코드 지름길
- 19 Jan [Python] 고급 리스트 기능
- 26 Dec 그래프 데이터베이스 소개와 Neo4j
- 25 Dec 글또 6기와 2021년 회고
- 01 Dec Isolation Forest 로 이상치 찾기 (+ SHAP로 설명하기)
- 03 Nov m1 맥에서 konlpy 쓰기
- 02 Nov 스파크의 Adaptive Query Execution
- 17 Oct 네트워크 분석이 알려주는 온라인 혐오 집단 대응법
- 22 Sep 라벨은 없지만 이상치는 찾고 싶어
- 05 Sep 스파크는 내 코드를 어떻게 실행할까? (Logical Plan과 Physical Plan)
- 22 Aug 차별하지 않는 분류 모델 만들기
- 04 Aug Label Propagation Algorithm
- 19 Jul 글또 6기 시작
- 01 Jun 데이터로 한국의 2030년 탄소 배출량 목표를 제안한다면
- 29 Apr 단변량 분포 간 거리 함수
- 07 Apr 내 스파크 잡을 구해줘 (아마도 성능 향상 팁들)
- 05 Mar Pygame으로 게임 만들어본 후기
- 01 Mar 스펙트럴 클러스터링 이해하기
- 05 Feb Koalas: 스파크에서 쓰는 Pandas API
- 09 Jan 사전훈련된 NLP 모델에서 성별 상관의 측정과 완화
- 11 Dec 인과 추론 3. 개입
- 11 Dec 인과 추론 2. 그래프와 확률
- 24 Nov 자동화된 팩트 체킹은 어디까지 왔나
- 07 Oct [Python] 일급함수, 클로저, 데코레이터
- 03 Oct [Python] 시퀀스
- 02 Oct [Python] 매직 매소드
- 01 Oct [Python] 메소드 ADVANCED
- 30 Aug 유튜브 추천 알고리즘과 극단주의 논쟁
- 16 Aug NLP 모델은 배리어 프리일까?
- 19 Jul 스파크 3.0의 새로워진 Pandas UDF
- 04 Jul 신경망 기반 언어 모델의 약점: Stolen Probability Effect
- 23 Jun [번역] PEGASUS: 추출된 빈 문장으로 사전훈련을 하는 새로운 추상적 문서 요약 모델
- 04 Jun 비모수 밀도 추정을 통한 클러스터링
- 24 May 스파크 GraphFrames 튜토리얼
- 26 Apr 주성분분석과 요인분석의 차이
- 28 Mar Fairness gym: 머신러닝 시스템의 장기적 영향
- 25 Mar 신경망 Backpropagation 계산 그래프 이해하기
- 13 Mar 인과 추론 1. 상관은 인과가 아닌데
- 29 Jul 알고리즘
- 29 Jul 자료구조 - 연결 리스트, 스택, 큐
- 28 Jul 프로세스와 스레드
- 28 Jul 자료구조 - 트리, 이진 트리, 이진 탐색 트리
- 28 Jul 메모리
- 27 Jul CPU
- 20 Jul [Python] 클래스
- 20 Jul [Python] 객체지향 프로그래밍
- 19 Jul [Python] 함수
- 03 Jun [SQL] User-Defined Function
- 03 Jun [SQL] Subquery 문제들
- 03 Jun [SQL] Window 함수 문제
- 03 Jun [SQL] GROUP BY COUNT 시 없는 시간대도 나오게 하려면?