Attention은 설명인가 아닌가
Attention의 설명력에 대한 논쟁들, Attention is not Explanation과 Attention is not not Explanation을 읽어보았습니다. 설명인가 아닌가, 설명이란 무엇인가… 어텐션은 설명이다? 어텐션(Attention) 매커니즘은 seq2seq RNN의 문제점을 해결하고 다양한 자연어처리 과제에서 뛰어난...
Attention의 설명력에 대한 논쟁들, Attention is not Explanation과 Attention is not not Explanation을 읽어보았습니다. 설명인가 아닌가, 설명이란 무엇인가… 어텐션은 설명이다? 어텐션(Attention) 매커니즘은 seq2seq RNN의 문제점을 해결하고 다양한 자연어처리 과제에서 뛰어난...
MLFlow 로 머신러닝 모델의 실험 트래킹/로깅을 처음 해보는 사람을 위한 간단한 튜토리얼입니다. 제가 처음 해보면서 썼습니다. 들어가기 전에 이 글을 보고 얻을 수 있는 정보는: MLflow 로 ML 실험을 기록하고 싶은데 어떻게 하는지 간단하게 알고 싶다/따라하고 싶다 Pyspark로도 쓰고 싶다 (+ Pan...
스파크의 RDD와 관련된 개념들(Transformation & Action, DAG, Lazy Evaluation)에 대해 무엇인지 쉽고 간단하게 정리해보는 글입니다. 스파크를 처음 접하게 되면 보통 아래와 같은 정보들을 순차적으로 접하게 됩니다. 아파치 스파크는 빅데이터를 위한 분산 병렬 처리 프레임워크다. 이전에 비슷한 목적...
트위터의 이미지 크롭 알고리즘을 둘러싼 인종차별 논란과 그 이후 트위터가 어떻게 대처했는지를 다룹니다. 자체 테스트와 알고리즘 편향 대회를 통해 발견된 내용들은 편리한 자동 크롭 기능이 어떤 의도치 않은 문제를 일으킬 수 있는지 보여줬습니다. 사건의 발단은 한 유저가 줌을 사용하면서 겪은 경험을 트위터에 공유하면서였습니다. 자신과 미팅을 한...
밀도 기반 클러스터링 방식인 DBSCAN의 알고리즘과 장단점, 구현 방식을 들여다보는 글입니다. DBSCAN은 오늘의 주제인 DBSCAN(Density-Based Spatial Clustering of Application with Noise)은 무려 96년도 논문(A density-based algorithm for discovering...
파이썬 스킬 업을 보고 정리한 내용입니다. 백분율 기호 연산자(%)를 사용한 포매팅 다음과 같이 2가지로 사용 포맷_문자열 % 값 print('n is %d' % n) 포맷_문자열 % (여러_값들) print(...
파이썬 스킬 업을 보고 정리한 내용입니다. 커맨드 라인에서 파이썬 실행하기 IDLE이나 스크립트보다 빠르게 실행할 수 있음 맥의 터미널에서 python3 test.py doc string 작성하고 사용하기 주석을 작성하거나 무료 온라인 도움말을 가져올 때 활용할 수 있음 예를 들어 ...
파이썬 스킬 업을 보고 정리한 내용입니다. 1 - 필요하다면 코드를 여러 줄에 걸쳐서 작성한다. 물리적으로 1줄보다 더 긴 문장을 작성하려면? #줄-연장 문자인 역슬래시 기호 사용 my_str = 'I am Hen-er-y the Eigth,' \ ' I am!' #괄호를 사용해서 물리적으로 다음 줄을 자동으로 연결 my_str =...
파이썬 스킬 업을 보고 정리한 내용입니다. 리스트 생성 및 활용 생성: 대입 연산자를 통해 가능, 빈 리스트 생성 후 append로 하나씩 추가하는 것도 가능 / remove 메서드로 삭제 ($*$ 그 값이 존재하지 않으면 ValueError) 주의: remove는 여러 개의 값이 존재할 경우 가장 첫번째 순서만 지...
그래프 데이터베이스의 기본 개념들과 Neo4j를 간단히 소개하고, 샌드박스 DB를 만들어 Python으로 연결해봅니다. 그래프 데이터베이스란? 그래프 이론에 토대를 둔 일종의 NoSQL 데이터베이스입니다. 데이터의 연결관계 저장에 있어 RDBMS 대비 가장 큰 장점은 인덱스 없이도 빠르게 연결된 노드를 찾을 수 있다는 점입니다(index-f...