본문 바로가기

ai 신뢰성6

311. [IDK] 토큰: AI 모델의 불확실성 관리와 신뢰성 강화 방법 https://arxiv.org/pdf/2412.06676해당 논문 링크: I Don’t Know: Explicit Modeling of Uncertainty with an [IDK] Token [IDK] 토큰: AI 모델의 불확실성 관리와 신뢰성 강화 방법 01. 서론: [IDK] 토큰이란?1) 불확실성을 명시적으로 표현하는 AI 모델의 새로운 접근법AI가 발전하면서, 대형 언어 모델(LLM)이 많은 정보를 처리하고 자연스러운 대화를 생성하는 데 성공했지만, 완벽하지는 않습니다. 특히, 모델이 확실하지 않은 정보에 대해 여전히 답변을 생성하려는 경향은 잘못된 정보 제공의 위험을 증가시킵니다. 이 문제를 해결하기 위해 제안된 "[IDK] 토큰(I Don’t Know)"은 AI가 모호하거나 확실하지 않은 .. 2024. 12. 14.

243. 대형 언어 모델의 한계: 커질수록 더 신뢰하기 어려운 이유 대형 언어 모델의 한계: 커질수록 더 신뢰하기 어려운 이유 https://www.nature.com/articles/s41586-024-07930-yLarger and more instructable language models become less reliable 01. 서론1) 대형 언어 모델의 발전과 현재의 문제대형 언어 모델(Large Language Models, LLM)은 지난 몇 년 동안 인공지능(AI) 연구의 핵심 기술로 자리 잡았습니다. GPT-3와 GPT-4와 같은 초대형 모델들이 출시되면서 자연어 처리(NLP) 기술은 빠르게 발전했고, 이들 모델은 다양한 분야에서 활용되고 있습니다. 언어 모델은 방대한 데이터셋을 학습하고 이를 기반으로 사람과 유사한 방식으로 질문에 답변하거나 창의적인.. 2024. 10. 7.

이전 1 2 다음

티스토리툴바