목록Computing Tech. Diary/Artificial Intelligence (45)
Douglas' Space

RouterDC는 "Query-Based Router by Dual Contrastive learning"의 줄임말입니다. 이 혁신적인 방법론은 여러 대규모 언어 모델(LLM)의 강점을 효율적으로 결합하기 위해 제안되었으며, 특정 쿼리에 가장 적합한 LLM을 동적으로 선택하는 "라우터" 역할을 수행합니다. 이 개념은 Shuhao Chen, Weisen Jiang, Baijiong Lin, James T. Kwok, Yu Zhang 연구진에 의해 최초로 제안되었습니다.1. RouterDC의 배경 및 개발 동기 LLM 앙상블의 부상: 최근 연구들은 여러 대규모 언어 모델(LLM)을 조합함으로써 그들의 상호 보완적인 능력을 활용할 수 있음을 보여주고 있습니다. 이러한 접근 방식은 개별 LLM의 한계를 극복하고..

■ Agent2Agent (A2A) 프로토콜 정의Agent2Agent (A2A) 프로토콜은 Google이 주도하여 개발한 개방형 프로토콜 사양으로, 서로 다른 플랫폼과 프레임워크 기반으로 구축된 AI 에이전트들이 서로를 발견하고, 안전하게 통신하며, 정보를 교환하고, 상호 작용을 협상하며, 행동을 조율할 수 있도록 설계된 표준화된 통신 계층이다. 이는 개별 에이전트의 내부 구현 세부 사항을 숨기는 추상화 계층 역할을 한다. ■ 핵심 아키텍처: 클라이언트 및 원격 에이전트 A2A는 두 가지 주요 에이전트 역할, 즉 클라이언트 에이전트(Client Agent)와 원격 에이전트(Remote Agent)를 정의한다.클라이언트 에이전트: 외부 전문 지식이 필요한 작업을 식별하고 시작하는 주체이다. 적절한..

MCP란 무엇인가? 핵심 정의 및 비유:모델 컨텍스트 프로토콜(MCP)은 Anthropic이 주도하여 개발한 개방형 표준 프로토콜로 , AI 애플리케이션(호스트/클라이언트)과 외부 시스템(서버) 간의 통신을 표준화하여 데이터와 도구를 제공하는 것을 목표로 한다. MCP는 종종 "AI 애플리케이션을 위한 USB-C 포트"에 비유되는데 , 이는 파편화되고 맞춤화된 기존 통합 방식을 대체하여 범용적인 연결성을 제공하려는 목표를 잘 보여준다. 즉, MCP는 LLM이 필요한 컨텍스트와 기능에 접근할 수 있는 표준화된 방법을 제공한다. 문자 그대로 해석하면 "모델 컨텍스트 프로토콜"은 AI 모델이 상황 정보를 다루는 규칙을 의미한다. 개발 목적 및 목표:MCP의 주요 목표는 AI 모델을 실시간 외부 데이터 및 도..

이번에는 분류모델에 대한 평가지표들을 알아보도록 하겠습니다. 평가지표를 알아보기 위해 먼저 평가를 위한 데이타를 분류하기 위한 분류표인 Confusion Matrix(혼동행렬)에 대해 알아 보도록 하겠습니다. 1. Confusion Matrix (혼동행렬) 아래 그림은 Confusion Matrix(혼동행렬)를 설명하는 표로, 머신러닝 및 통계 분석에서 모델의 성능 평가를 위해 자주 사용됩니다. 혼동 행렬은 예측값(출력값)과 실제값의 조합을 비교하여 모델이 얼마나 정확히 분류했는지 분석하는 데 사용됩니다. True Positive (TP): 모델이 양성(Positive)이라고 예측했고, 실제로도 양성인 경우. (예: 암 진단 모델이 암이 있는 환자를 올바르게 암으로 예측한 경우)False Positi..

Ai기반 시스템의 시험평가를 위해서는 머신러닝 모델들의 다양한 평가지표를 이해하고 적절히 활용해야 합니다. 이번 부터 모델의 유형이나 목적에 따라 다르게 적용될 수 있는 여러 평가지표를 살펴보겠습니다. 먼저 회귀모델에 대한 평가지표를 살펴보겠습니다. 1. MSE (Mean Square Error, 평균 제곱 오차)정의: MSE는 예측값과 실제값의 차이를 제곱한 후 평균을 구하는 방법입니다. 특징:오차의 제곱을 취하기 때문에 큰 오차에 대해 패널티가 큽니다. 즉, 큰 오차를 강조하는 특성을 가집니다.제곱을 사용하여 모든 오차가 양수로 변하므로, 양수와 음수 오차가 상쇄되지 않습니다.RMSE (Root Mean Square Error)와 MAE (Mean Absolute Error)도 유사한 방식으로 사..

이제는 너무나도 잘아는 chatGPT(Generatie Pre-trained Transformer)이지만 워낙 화두가 되다보니 이에 대해 글을 정리할 필요가 있어서 본 글을 작성해 보았습니다. chatGPT를 이용하거나 사용하는 관점이라기 보다 어떻게 chatGPT가 만들어졌는지의 관점에서 기존의 이 섹션에서 소개한 인공지능 기술들을 기준으로 설명을 드리고자 합니다. (사실 GPT의 마지막단어가 Transformer라는 것을 생각하면 지난번 소개한 구글의 Transformer모델이 등장하면서 언어모델 뿐만 아니라 다른 인공지능 모델에 많은 영향을 주었습니다. GPT3 등과 같은 초거대언어모델 및 멀티모달 인공지능 모델, 자기주도학습모델 들이 예견되었다고 해도 과언이 아닐 정도로 Transformer기술이..

DARPA는 신뢰성, 안전성, 보안성, 생존성 등을 요구하는 defense system과 같은 dependable system에는 학습데이타에 양과 질에 의존적인 딥러닝 기반의 data-driven Ai는 한계가 존재한다고 인식하고 있습니다. 또한 ANI(artificial narrow intelligence)를 넘어 AGI(artificial general intelligence)로 발전하기 위해서는 새로운 인공지능 기술이 필요함을 인식하고 이를 위해서는 사람이 갖고 있는 상식이나 기본적인 배경지식을 포함하는 contextual model을 구축하는 것을 목표로 하고 있습니다. 이러한 새로운 Ai의 접근을 contextual adaptation이라고 지칭하며 이를 위한 알고리즘과 구조를 개발하기 위한 ..

ACE(Air Combat Evolution) 프로그램은 유인조종사와 함께 협업할 무인기에 탑재될 Ai조종사의 성능과 신뢰성을 검증하고 실현하기 위한 프로그램입니다. 프로그램의 이름처럼 공중에서의 전투 혁명을 이루려고 하는 DARPA의 Ai 프로그램 중의 하나입니다. ACE는 도그파이팅 문제에 AI 기술을 적용해 현실감을 높이는 실험을 진행하고 있습니다. 프로그램은 크게 4개의 TA(Technical Area)로 나누어져 3단계로 진행될 예정으로 계획되어 있습니다. TA1은 개인 및 팀 수준(local behavior)의 전투성능을 발휘하는 인공지능 알고리즘 개발을 목표하며, TA2는 이러한 local behavior의 전투성능에 대한 신뢰성을 측정하고 검증합니다. TA3는 이질적인 다수의 전투기(glo..

DARPA는 2018년에 “AI Next” 캠페인을 발표하고 AI 분야에 많은 투자를 진행하고 있습니다. 이 캠페인을 시작하면서 DARPA는 50년간의 오랜 기간 동안 인공지능에 투자를 한 성과를 기반으로, 인공지능의 1, 2세대를 지나 새롭게 인공지능의 제3세대를 개척하겠다는 목표로 “Artificial Intelligence Exploration(AIE)” 라는 프로그램을 런칭하였습니다. 현재 AIE라는 프로그램 내에서 많은 AI관련 프로젝트가 진행되고 있습니다. DARPA는 3세대의 인공지능은 기계가 인간이 프로그래밍한 규칙을 실행하거나 인간이 선별한 데이터 세트를 일반화하는 단순한 도구를 넘어서 인간의 동료가 될 것이라고 기대하고 있습니다. DARPA는 맥락을 이해하고 추론하는 기계를 제공하는 제..

앨런튜링은 생각하는 기계를 만들고 싶어하였고, 그것이 결국 오늘날 컴퓨터의 효시가 되었습니다. 따라서 컴퓨터는 사람이 하고자 하는 일을 대신해 주는 에이전트의 역할을 수행하도록 여러가지 형태로 발전되어 왔다고 할 수 있습니다. 인간과 컴퓨터를 시스템이론 관점에서 살펴보면 “입력(Input)-처리(Process)-출력(Output)”, IPO로 추상화하여 소개할 수 있습니다. 따라서 인공지능은 인간의 에이전트로서 컴퓨터에 지능을 구현하는 것이라 할 수 있으며, 주로 소프트웨어인 프로그램(데이터를 포함)으로 구현된다고 할 수 있습니다 . 지능은 IPO관점에서 P에 해당하는 인간의 뇌의 활동에 의한 능력을 구현하는 것이라고 말할 수 있습니다. 그렇다면 인간의 지능이란 무엇일까요? 지능은 한마디로 정의하기 어렵..