본문 바로가기
반응형

AI 윤리25

374. AI 모델의 보안 강화: Universal Jailbreaks 방어 전략 AI 모델의 보안 강화: Universal Jailbreaks 방어 전략 01. 서론AI 기술이 발전함에 따라, 대규모 언어 모델(LLM)들은 안전하고 신뢰할 수 있는 방식으로 동작해야 한다는 요구가 커지고 있습니다. 특히, Jailbreaking(보안 우회 공격)은 AI 모델이 의도치 않게 위험한 정보를 생성하도록 유도하는 기법으로, 지속적인 보안 위협이 되고 있습니다. 최근 Anthropic의 연구에서는 "Constitutional Classifiers"라는 새로운 방어 시스템을 통해 Universal Jailbreaks(보편적 보안 우회 공격)를 차단하는 방법이 제안되었습니다. 본 글에서는 Universal Jailbreaks란 무엇인지, 이를 방어하기 위한 Constitutional Classif.. 2025. 2. 14.
362. 파리 AI 행동 정상회의: 글로벌 AI 규제와 미래 방향 파리 AI 행동 정상회의: 글로벌 AI 규제와 미래 방향 서론전 세계 AI 주요국들이 프랑스 파리에서 열리는 '파리 AI 행동 정상회의'(AI Action Summit)에 모여 안전한 AI 발전과 규제 방향에 대해 논의합니다. 이번 정상회의는 AI 기술의 발전 속도가 급격히 빨라지는 가운데, 각국이 협력하여 AI의 위험성을 최소화하고 글로벌 표준을 정립하기 위한 목적으로 개최됩니다. 이번 행사에는 미국, 중국, 유럽연합(EU)을 비롯한 100여 개국과 1,000명 이상의 업계 전문가, 정부 관계자, 시민 단체 대표들이 참석하여 공익 AI, AI와 노동의 미래, AI 혁신과 문화, 신뢰 가능한 AI, 글로벌 AI 거버넌스 등의 주요 주제를 논의합니다. 특히 한국에서는 유상임 과학기술정보통신부 장관이 주요 .. 2025. 2. 10.
350. 딥시크(DeepSeek), 중국판 ChatGPT? AI 시장에서의 가능성과 한계 딥시크(DeepSeek), 중국판 ChatGPT? AI 시장에서의 가능성과 한계 01. 서론최근 인공지능(AI) 시장에서 새로운 도전자로 주목받고 있는 딥시크(DeepSeek)가 글로벌 AI 산업과 중국 시장에서의 입지를 강화하고 있습니다. 중국 내에서 자체 AI 기술을 개발하고 있는 딥시크는 ChatGPT와 같은 대형 언어 모델(Large Language Model, LLM)과 경쟁하며, 언어 처리 기술을 기반으로 한 AI 서비스를 제공하고 있습니다. 그러나 딥시크의 성장과 함께 다양한 논란도 제기되고 있습니다. 중국 정부의 검열과 AI 모델의 자유로운 정보 제공 간의 균형, 국제 시장에서의 확장 가능성, 그리고 AI 기술의 윤리적 이슈 등이 주요 쟁점으로 떠오르고 있습니다. 본 글에서는 딥시크의 주요.. 2025. 2. 2.
346. Computer-Using Agent: Operator의 혁신과 AI 작업 자동화의 미래 Computer-Using Agent: Operator의 혁신과 AI 작업 자동화의 미래 01. AI와 Computer-Using Agent의 등장AI 기술은 현대 사회에서 필수적인 요소로 자리 잡으며, 일상과 업무 환경을 혁신하고 있습니다. 특히 반복적이고 비효율적인 작업을 자동화하는 AI 기반 도구는 생산성 향상과 시간 절약 측면에서 기업과 개인에게 큰 도움을 주고 있습니다. 이러한 필요성을 충족하기 위해 OpenAI가 선보인 Computer-Using Agent: Operator는 작업 자동화의 새로운 기준을 제시하고 있습니다. Operator는 단순한 자동화 도구가 아니라, AI 기술을 활용해 사용자의 웹 브라우징, 데이터 처리, 검색 작업을 자동으로 수행할 수 있는 종합적인 솔루션입니다. 특히 .. 2025. 1. 29.
반응형

TOP

Designed by 티스토리