허깅 페이스 Transformers에서 DistilBERT 기반 작업 클래스들

인공지능/BERT 계열 이해

허깅 페이스 Transformers에서 DistilBERT 기반 작업 클래스들

FedTensor 2025. 10. 13. 14:21

허깅 페이스의 Transformers 라이브러리는 DistilBERT 모델을 기반으로 구체적인 작업을 수행하도록 구현한 클래스들을 제공합니다. 이 문서에서는 이들의 작업 유형, 출력층, 그리고 손실함수들을 표로 정리하였습니다.

작업 구현 클래스

1. DistilBertForMaskedLM

작업 유형	출력층	손실함수
빈 칸의 단어 맞추기	vocab_transform activation vocab_layer_norm vocab_projector	nn.CrossEntropyLoss

2. DistilBertForSequenceClassification

작업 유형	출력층	손실함수
점수 매기기 (예: 호감도)	pre_classifer dropout classife	nn.MSELoss
한 개의 라벨 할당 (예: 감정 분석)	pre_classifer dropout classifer	nn.CrossEntropyLoss
여러 개의 라벨 할당 (예: 문서 태깅)	pre_classifer dropout classifer	nn.BCEWithLogitsLoss

3. DistilBertForTokenClassification

작업 유형	출력층	손실함수
토큰 분류 (예: 품사 태깅)	dropout classifier	nn.CrossEntropyLoss

4. DistilBertForQuestionAnswering

작업 유형	출력층	손실함수
추출적 질의응답 (지문에서 답 찾기)	dropout qa_outputs	nn.CrossEntropyLoss

5. DistilBertForMultipleChoice

작업 유형	출력층	손실함수
객관식 문제 풀이	pre_classifer dropout classifer	nn.CrossEntropyLoss

참고 자료

작업 레시피

'인공지능 > BERT 계열 이해' 카테고리의 다른 글

BERT의 마스크드 언어 모델 상세 설명 (0)	2025.10.23
DistilBERT + KorQuAD MLM 훈련 소요 시간 비교 (RTX 4090, T4, A100) (0)	2025.10.18
BERT, GPT-2, XLNet 학습 방식 비교: 양방향, 단방향, 순열 (0)	2025.10.11

현재글허깅 페이스 Transformers에서 DistilBERT 기반 작업 클래스들

FedTensor

데이터의 보호와 활용 - 천천히, 제대로

타원곡선암호, 개인정보보호, 보안다자간계산, kl발산, 데이터이질성, 데이터분석, ECC, 신경세포, 사이버보안, 차등정보보호, non-iid, 신경망, 뇌가소성, 정보보호, 엔트로피, 이질적데이터, ecdlp, secagg+, 이산로그문제, 인공지능, 안전한집계, 차분프라이버시, 비밀공유, 푸아송분포, 연합학습, 최소작용의원리, smpc, 멱법칙, 트랜스포머, 베이지안추론,

Today :
Yesterday :

일	월	화	수	목	금	토
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30	31

FedTensor

허깅 페이스 Transformers에서 DistilBERT 기반 작업 클래스들

작업 구현 클래스

1. DistilBertForMaskedLM

2. DistilBertForSequenceClassification

3. DistilBertForTokenClassification

4. DistilBertForQuestionAnswering

5. DistilBertForMultipleChoice

참고 자료

작업 레시피

'인공지능 > BERT 계열 이해' 카테고리의 다른 글

'인공지능/BERT 계열 이해'의 다른글

티스토리툴바

허깅 페이스 Transformers에서 DistilBERT 기반 작업 클래스들

작업 구현 클래스

1. DistilBertForMaskedLM

2. DistilBertForSequenceClassification

3. DistilBertForTokenClassification

4. DistilBertForQuestionAnswering

5. DistilBertForMultipleChoice

참고 자료

작업 레시피

'인공지능 > BERT 계열 이해' 카테고리의 다른 글

'인공지능/BERT 계열 이해'의 다른글

관련글

티스토리툴바