본문 바로가기

AI

(213)
AI 에이전트, 회사에 바로 투입해도 될까? AI 에이전트 결론부터 말하면 아직은 ‘일 잘하는 인턴’ 수준이야!!요즘 어디 가나 이런 말 나오지. “이제 AI 에이전트가 일 다 해준다”, “사람 필요 없어지는 거 아님?”핵심 질문은 이거야. “AI 에이전트, 진짜 회사 업무에 넣어도 되냐?”새로 나온 벤치마크 APEX-Agents 결과를 보면,답은 꽤 솔직하게 나와~ 👉 아직은 아니다.[참조: https://arxiv.org/abs/2601.14242] 왜 기존 테스트로는 부족했을까?기존 AI 벤치마크들 보면 이런 느낌이야. 퀴즈 잘 풀어? 일반 상식 알아? 문장 이해해?근데 회사 일은 그런 게 아니잖아. 예를 들어 슬랙 뒤지고 구글 드라이브 문서 찾고 메일 맥락 맞춰 보고 법, 내부 규정 같이 고려하고 “이거 해도 되는지” 판단해야 함.....
Anthropic Cowork 등장 이제 AI 에이전트는 개발자 전용이 아니다 요즘 에이전트, 다들 한 번씩은 들어봤지.근데 막상 써보려 하면 CLI 깔고, 토큰 넣고, 설정하다가 지치는 경우가 대부분이야.Anthropic이 이번에 내놓은 Cowork는 그 진입장벽을 아예 없애버린 도구야. 한 줄로 말하면 이거야.“Claude Code를 코드 없이 쓰게 만든 데스크톱 에이전트.” Cowork가 뭐냐면Cowork는 Claude Desktop 안에 들어간 폴더 기반 AI 에이전트야.사용자가 지정한 특정 폴더만 보고, 그 안에서만 작업을 해. 파일을 읽고, 만들고, 수정하고, 필요하면 삭제까지 해주는데이걸 전부 채팅으로 시켜. “이 폴더 안에 있는 영수증 이미지들 모아서 경비 보고서 만들어줘” 이 한 문장으로 끝이야.내 느낌에는 작년 초에 M..
Humans&는 AI 스타트업이 아니라 조직 실험에 가깝다 요즘 AI 스타트업 뉴스 보면 다 비슷해 보여.더 큰 모델, 더 빠른 추론, 더 높은 벤치마크 점수.근데 Humans& 얘기는 결이 좀 달라. 이 회사는 “또 하나의 초거대 AI 스타트업”이라기보다는,아예 조직 구조 자체를 다시 짜보겠다는 실험에 더 가까워 보여. 설립 3개월, 시드 4억 8천만 달러이 판이 보통이 아닌 이유 Humans&는 설립 3개월 만에 시드 단계에서 4억 8천만 달러를 받았어.기업가치는 44억 8천만 달러. 숫자만 보면 이미 유니콘을 넘어선 상태야. 투자자 라인업도 메시지가 분명해.엔비디아, 제프 베이조스, GV, SV Angel, Emerson Collective. 이 정도면 “유망해서 조금 넣어보자”가 아니라“이 판이 바뀔 수 있다”는 쪽에 베팅한 느낌이야.실패해도 경험치로 ..
BioticsAI는 어떻게 ‘데모 회사’에서 ‘의료 인프라’가 됐을까 AI 스타트업 얘기하다 보면 꼭 나오는 말이 있어.“의료는 규제가 너무 빡세서 힘들다”“FDA는 몇 년씩 걸린다”“우리도 언젠가는 병원 들어가야지…”근데 이걸 말이 아니라 실제로 3년 만에 해낸 팀이 있다.이름은 BioticsAI. 이 팀이 흥미로운 이유는 단순히 FDA 허가를 받았기 때문이 아니야.이 팀은 처음부터 ‘AI → 제품 → 임상 → 규제’를 한 줄로 묶어서 설계했다는 점이 다르다. BioticsAI 한 줄 요약태아 초음파에서 놓치기 쉬운 이상 징후를 더 잘 보이게 만들어주는 AI 소프트웨어조금 더 풀어보면 이렇다.산모·태아 초음파 영상을 AI로 분석해서검사 품질이 괜찮은지 확인해주고꼭 찍혀야 할 해부학적 구조가 다 나왔는지 체크하고결과를 자동으로 리포트까지 만들어준다중요한 건, 이 AI는 ‘..
메타가 10대용 AI 캐릭터를 잠시 꺼버린 진짜 이유 메타가 갑자기 전 세계 10대 사용자들에게 AI 캐릭터 사용을 잠시 중단하겠다고 발표했어. 인스타그램, 메신저, 페이스북까지 메타 앱 전반에 적용되는 조치야. 겉으로 보면 “서비스 접었다”라기보다는 10대용으로 더 강력한 새 버전을 만들기 위한 일시 중단이라는 설명이 붙어 있어. 근데 타이밍을 보면, 그냥 기능 개선이라고 보기엔 좀 묘해. 메타가 밝힌 공식 이유는 뭐냐면메타의 공식 입장은 꽤 정석적이야. 부모들로부터 이런 요구가 계속 들어왔다는 거지.우리 애가 AI랑 무슨 대화를 하는지 알고 싶다차단이나 제어 기능을 더 강하게 해달라아예 AI를 못 쓰게 하는 옵션도 필요하다그래서 당분간은 10대 계정에서 AI 캐릭터 기능을 전면 차단하고, 부모 통제 기능을 더 강화한 새 버전을 준비해서 다시 열겠다는 ..
구글은 왜 제미나이를 ‘챗봇’이 아니라 ‘일꾼’으로 키우는가 검색의 종말이 아니라, 일하는 방식의 재설계 구글이 제미나이를 밀고 가는 방향은 꽤 명확해.더 똑똑한 답변을 만드는 게 아니라, 사람 대신 일을 끝내는 존재로 만들겠다는 거야. 이걸 이해하면 검색, 포털, 커머스, 마케팅이 왜 한 번에 흔들리는지도 같이 보이기 시작해. 검색창은 줄고, 부탁은 늘어난다지금까지의 인터넷은 항상 이 순서였지. 검색 → 비교 → 클릭 → 사이트 이동 → 로그인 → 결제구글이 지금 제미나이로 하려는 건 이걸 전부 접어버리는 거야.앞으로는 이렇게 간다. 부탁 한 줄 → 결과 확인 → 동의“다음 주 출장에 신을 편한 신발 하나 사줘”이 한 줄로 탐색, 비교, 추천, 결제까지 끝내겠다는 거지. 여기서 중요한 건, 검색 결과를 잘 보여주는 게 아니라 결과물 자체를 내놓는다는 점이야. 페..
Agent AI에서 Physical AI까지, 지금 내가 느끼는 진짜 위기 솔직히 요즘은 AI 이야기가 나오면 괜히 허리를 한 번 펴게 된다.예전처럼 흥미로운 기술 트렌드 정도가 아니라, 이제는 내 자리랑 직접 연결된 얘기처럼 들리기 때문이다. 어느 순간부터 분위기가 달라졌다2026년 초, 신년회에서 대표님이 말했다. "올해는 AI를 적극적으로 활용합시다."이 말이 예전처럼 가볍게 들리지 않았다. 혁신, 효율, 디지털 전환 같은 말이 아니라 "이제 준비 안 되면 위험하다"는 경고처럼 느껴졌다. 며칠 뒤 다른 회사랑 미팅을 하는데 거기서도 자연스럽게 AI 이야기가 나왔다.속도가 너무 빠르다는 말, 생각보다 많은 일을 이미 대체하고 있다는 말. 특히 업계에서 오래 근무하신 분들이 "나도 솔직히 불안하다"고 말할 때, 아 이건 진짜구나 싶었다. Agent AI까진 괜찮았다. 문제는..
Anthropic이 진짜 던진 질문 AI는 도구인가, 존재인가 Anthropic이 또 한 번 판을 흔들었어.이번엔 모델 성능 얘기가 아니야. 파라미터 몇 개 늘렸다는 소식도 아니고, 벤치마크 점수 자랑도 아니야.이번에 꺼낸 건 무려 80페이지짜리 문서, 이름부터 클로드의 헌법이야. 참조: https://www.anthropic.com/constitution그리고 문서 맨 마지막에서 이런 질문을 대놓고 던져. 이거… 의식 있는 거 아니냐? 이번에 뭐가 바뀐 거냐이번에 공개된 클로드 헌법은 간단히 말하면 이거야.클로드라는 AI가 어떤 가치관으로 판단하고, 어디까지 허용되고, 어디서 멈춰야 하는지를 전부 문서로 박아둔 거.Anthropic은 이 개정판을 다보스 포럼 일정에 맞춰 공개했어. 메시지는 명확해.우리는 단순한 언어모델을 만드는 회사가..