HOME
CATEGORIES
TAGS
ARCHIVES
ABOUT
NOTES

Home Archives

Archives

Archives

2025

26 May vec2vec, 서로 다른 공간에서 온 임베딩을 번역하다
28 Mar 글또를 보내며 테크 블로그 5년 돌아보기
08 Mar LLM 시대의 추천 시스템
14 Feb ML 코드로 배워보는 SOLID 원칙
07 Feb 스포티파이는 어떻게 유저의 변하는 관심사를 모델링할까
18 Jan GPU OOM과 이별하는 법

2024

25 Dec 산은 산이 있는 곳에 있다
30 Nov Variational Autoencoder 이해하기
10 Nov 라벨이 불균형하면 오버샘플링을 하라던데
16 Oct 6년차 데이터 어쩌구의 첫 이직 준비 후기와 팁
12 Oct 시계열 이상 탐지할 때 데이터 분포가 바뀐다면
12 May 글또 9기 끝
30 Mar Conformal Prediction으로 모델의 불확실성 계산하기
16 Mar 머신러닝 모델을 해석할 때 주의해야 할 8가지
03 Mar 옵시디언 사용기 (필수 플러그인, 블로그 글 쓰기, 해빗 트래커, 디지털 서재)
09 Feb 수학을 까먹은 사람을 위한 특이값분해(SVD)
21 Jan 스파크 UDTF(User-Defined Table Function)
07 Jan DTW로 시계열 클러스터링하기

2023

31 Dec 수학을 까먹은 사람을 위한 고유값분해와 주성분분석(PCA)
19 Dec 슬랙 워크플로(workflow)로 팀 생산성 높이기
02 Dec 데이터와 모델만 있으면 끝인 건가? 에 대한 단상
12 Jul 글또 8기 회고
18 Jun AI의 존재론적 위협보다 중요한 것들에 대해
14 May 아직도 커널이 뭔지 모르겠어요
04 May 1년 간 데이터 분석가 채용에 참여하며 느낀 점
15 Apr GPT가 내 일자리를 뺏을 가능성은?
25 Mar 왜 딥러닝은 정형 데이터에 잘 안 통할까
12 Mar 기록이 나 대신 업무를 기억하게 하는 법
06 Feb Data Drift 발견하기
05 Feb 글또 8기 시작

2022

09 Oct 글또 7기 회고
02 Oct LDA (잠재 디리클레 할당) 이해하기
18 Sep Subset Scanning으로 이상한 부분집합 찾기
04 Sep 그래프 DB - Cypher 기초
21 Aug 새로운 인풋을 찾는 데이터 분석가를 위한 뉴스레터 추천
22 Jul Attention은 설명인가 아닌가
10 Jul MLFlow Tracking 튜토리얼
08 Jun 스파크가 뭔지만 대충 아는 사람을 위한 RDD 설명
28 May 트위터의 이미지 크롭 알고리즘은 뭐가 문제였을까
07 May DBSCAN 이해하기

2021

26 Dec 그래프 데이터베이스 소개와 Neo4j
25 Dec 글또 6기와 2021년 회고
01 Dec Isolation Forest 로 이상치 찾기 (+ SHAP로 설명하기)
02 Nov 스파크의 Adaptive Query Execution
17 Oct 네트워크 분석이 알려주는 온라인 혐오 집단 대응법
22 Sep 라벨은 없지만 이상치는 찾고 싶어
05 Sep 스파크는 내 코드를 어떻게 실행할까? (Logical Plan과 Physical Plan)
22 Aug 차별하지 않는 분류 모델 만들기
04 Aug Label Propagation Algorithm
19 Jul 글또 6기 시작
01 Jun 데이터로 한국의 2030년 탄소 배출량 목표를 제안한다면
29 Apr 단변량 분포 간 거리 함수
07 Apr 내 스파크 잡을 구해줘 (아마도 성능 향상 팁들)
05 Mar Pygame으로 게임 만들어본 후기
01 Mar 스펙트럴 클러스터링 이해하기
05 Feb Koalas: 스파크에서 쓰는 Pandas API
09 Jan 사전훈련된 NLP 모델에서 성별 상관의 측정과 완화

2020

11 Dec 인과 추론 3. 개입
11 Dec 인과 추론 2. 그래프와 확률
24 Nov 자동화된 팩트 체킹은 어디까지 왔나
30 Aug 유튜브 추천 알고리즘과 극단주의 논쟁
16 Aug NLP 모델은 배리어 프리일까?
19 Jul 스파크 3.0의 새로워진 Pandas UDF
04 Jul 신경망 기반 언어 모델의 약점: Stolen Probability Effect
23 Jun [번역] PEGASUS: 추출된 빈 문장으로 사전훈련을 하는 새로운 추상적 문서 요약 모델
04 Jun 비모수 밀도 추정을 통한 클러스터링
24 May 스파크 GraphFrames 튜토리얼
26 Apr 주성분분석과 요인분석의 차이
28 Mar Fairness gym: 머신러닝 시스템의 장기적 영향
13 Mar 인과 추론 1. 상관은 인과가 아닌데

Recently Updated

글또를 보내며 테크 블로그 5년 돌아보기
ML 코드로 배워보는 SOLID 원칙
GPU OOM과 이별하는 법
Variational Autoencoder 이해하기
6년차 데이터 어쩌구의 첫 이직 준비 후기와 팁

Trending Tags

ml ai-in-society spark geultto graph nlp unsupervised-learning anomaly-detection causal-inference recsys

© 2025 pizzathiefz. Some rights reserved.

Using the Chirpy theme for Jekyll

Trending Tags

ml ai-in-society spark geultto graph nlp unsupervised-learning anomaly-detection causal-inference recsys

A new version of content is available.