GDPval (1) 썸네일형 리스트형 AI 에이전트, 회사에 바로 투입해도 될까? AI 에이전트 결론부터 말하면 아직은 ‘일 잘하는 인턴’ 수준이야!!요즘 어디 가나 이런 말 나오지. “이제 AI 에이전트가 일 다 해준다”, “사람 필요 없어지는 거 아님?”핵심 질문은 이거야. “AI 에이전트, 진짜 회사 업무에 넣어도 되냐?”새로 나온 벤치마크 APEX-Agents 결과를 보면,답은 꽤 솔직하게 나와~ 👉 아직은 아니다.[참조: https://arxiv.org/abs/2601.14242] 왜 기존 테스트로는 부족했을까?기존 AI 벤치마크들 보면 이런 느낌이야. 퀴즈 잘 풀어? 일반 상식 알아? 문장 이해해?근데 회사 일은 그런 게 아니잖아. 예를 들어 슬랙 뒤지고 구글 드라이브 문서 찾고 메일 맥락 맞춰 보고 법, 내부 규정 같이 고려하고 “이거 해도 되는지” 판단해야 함..... 이전 1 다음