멀티모달

아밋 제인 "글보다 영상을 보는 시대…AI도 동영상이 대세죠"

“사람들은 더 이상 글을 읽는 걸 좋아하지 않습니다. 공부할 때도, 여가를 보낼 때도 영상을 봅니다.”지난 5일 미국 라스베이거스에서 열린 ‘AWS 리인벤트 2024’에서 만난 아밋 제인 루마AI 공동창업자 겸 최고경영자(CE...

2024.12.12 17:28
루마AI CEO "AI가 일자리 빼앗는다?…오히려 제2의 문명 불러올 것"

“사람들은 더 이상 글을 읽는 걸 좋아하지 않습니다. 공부할 때도 여가시간을 보낼 때도 영상을 봅니다.”지난 5일 미국 라스베이거스에서 열린 ‘AWS 리인벤트 2024’에서 만난 아밋 제인 루마AI 공동창업자 겸 최고경영자(C...

2024.12.11 10:13
엔씨, 시각화 AI '바르코 비전' 출시

엔씨소프트는 한국어와 영어를 모두 쓸 수 있는 중소형 시각화 언어모델(VLM) ‘바르코 비전’을 출시한다고 4일 발표했다. VLM은 자연어와 이미지를 함께 입력할 수 있는 인공지능(AI)이다.엔씨소프트는 바르코 비전이 이미지 기반 질의응답, 이미지 설명, 글자 인식, 사물 위치 검출 등의 AI 작업에 쓰일 것으로 기대하고 있다. 기업 ...

2024.12.04 17:13
"애플·앤스로픽도 우리 AI칩 쓴다"…아마존, 엔비디아 천하에 도전

아마존이 새로운 멀티모달 인공지능(AI) 모델을 전격 공개했다. AI 챗봇에 특화된 경량형 모델부터 자사 최초의 영상 생성 AI 모델까지 제품군을 다양화한 게 특징이다. 여기에 신형 자체 AI 칩까지 공개해 소프트웨어에서 하드웨어에 이르는 거대한 AI 제품군을 완성했다...

2024.12.04 17:09
엔씨, 한국어 쓰는 시각화 AI '바르코 비전' 공개

엔씨소프트는 한국어와 영어를 모두 쓸 수 있는 시각화 언어모델(VLM)인 ‘바르코 비전’을 출시한다고 4일 발표했다. VLM은 자연어와 이미지를 함께 입력할 수 있는 인공지능(AI)이다.엔씨소프트는 바르코 비전이 이미지 기반 질의응답, 이미지 설명...

2024.12.04 15:02
아마존, 오픈AI·엔비디아 정조준…AI 생태계 무한확장[송영찬의 실밸포커스]

아마존이 새로운 멀티모달 인공지능(AI) 모델을 전격 공개했다. AI 챗봇에 특화된 경량형 모델부터 자사 최초의 영상 생성 AI 모델까지 제품군을 다양화한 게 특징이다. 여기에 신형 자체 AI 칩까지 공개하며 소프트웨어에서 하드웨어에 이르는 거대한 A...

2024.12.04 10:14
"AI가 모든 소프트웨어를 연결할 것"

“인공지능(AI)이 운영체제(OS)의 지위를 넘보고 있다.”<박태웅의 AI 강의 2025>를 쓴 박태웅 녹서포럼 의장은 AI의 발전 방향을 이렇게 전망했다. 1~2년 안에 거의 모든 소프트웨어가 어떤 형태로든 AI와 연동하는 형태를 갖출 것이란 뜻...

2024.09.27 18:06
“AI가 모든 소프트웨어를 연결할 것” [서평]

“인공지능(AI)이 운영체제(OS)의 지위를 넘보고 있다.” <박태웅의 AI 강의 2025>를 쓴 박태웅 녹서포럼 의장은 AI의 발전 방향을 이렇게 전망했다. 1~2년 안에 거의 모든 소프트웨어가 어떤 형태로든 AI와 연동하는 형태를 갖게...

2024.09.27 10:54
'말발 대결'에 빅테크 대거 참전…네이버도 '음성 AI' 뛰어들었다

생성형 인공지능(AI) 경쟁 구도가 텍스트와 이미지·영상을 넘어 음성 영역에서도 본격화됐다. 글로벌 빅테크 기업들이 음성 기능을 지원하는 생성형 AI 서비스를 선보였고 네이버도 이에 뒤질세라 관련 기술을 공개하고 나섰다. 업계 안팎에선 음성 기반의 생성형 ...

2024.08.26 16:39
클릭 5번에 챗봇 완성…'쉬운 AI'만 살아남는다

빅테크의 ‘인공지능(AI) 쉽게 사용하기’ 경쟁이 뜨거워지고 있다. 복잡한 데이터를 일반인도 쉽게 다룰 수 있게 한 AI 서비스가 하루가 멀다고 쏟아지는 모양새다. 벌써부터 업계에서 AI 전문 개발자의 시대가 저물고 있다는 분석이 나온다. ...

2024.06.21 18:29
'천비디아' 만든 황의 매직…"새 시대 이끌 AI칩 나온다"

인공지능(AI) 칩 강자인 엔비디아가 장외에서 주당 1000달러 고지를 넘어섰다. 올해 1분기 실적이 시장 예상치를 크게 웃돈 데다 멀티모달 AI 시대를 맞아 엔비디아의 차세대 AI 칩이 더 많은 성장을 이끌 것이라는 기대까지 더해져 주가가 치솟았다.22일(현지시간) ...

2024.05.23 18:10
"모든 곳에 AI 스며들게 만든다"…MS, 내놓는 新무기 뭐길래

마이크로소프트(MS)가 ‘인공지능(AI) 에이전트’를 생활과 업무 곳곳에 스며들 수 있도록 관련 서비스와 제품을 대거 들고나왔다. 멀티모달 AI 시대가 본격화한 만큼 이를 보다 많은 사용자가 활용할 수 있도록 클라우드부터 PC까지 촘촘하게 배치한 ...

2024.05.22 08:43
글 읽고 영상 만드는 AI…오픈AI "하반기 상용화"

오픈AI의 또 다른 신무기는 ‘동영상 AI(인공지능)’다. 이 회사가 지난달 공개해 이목을 집중시킨 동영상 생성형 AI ‘소라’를 일반인도 올해 하반기에 이용할 수 있을 전망이다. 컴퓨팅 파워 문제로 상용화가 더디게 이뤄질 것이란 관측을 뒤엎은 것이다.미라 무라티 오픈AI 최고기술책임자(CTO)는 13일(현지시간)...

2024.03.14 18:44
클라우드에 AI 끼워 판다…구글 'B2B 제미나이' 내놔

“영상만 올리면 됩니다. 소개 글은 인공지능(AI)이 알아서 써 줍니다.”구글 클라우드가 지난 11일 연 온라인 미디어 브리핑에 참석한 네샤드 바돌리왈라 제품총괄의 설명이다. 그가 구글 클라우드 내 버텍스 AI 플랫폼에 집을 촬영한 동영상을 올리자...

2023.12.14 00:01
구글 자신한 AI 이미지 분석…"아직 불안정"

구글은 6일(현지시간) 인공지능(AI) 멀티모달 모델 제미나이를 공개하면서 이를 적용한 챗봇 바드도 함께 내놓았다. 문서뿐만 아니라 이미지, 음성 등을 분석하고 추론할 수 있도록 한 것이다. 멀티모달 기능을 사용하기 위해선 월 20달러짜리 챗GPT 플러스를 구독해야 하...

2023.12.07 18:07
'AI 반격' 나선 구글…손으로 푼 수학문제, 첨삭지도까지

“가장 뛰어나면서 범용적인 모델이다.”구글은 5일(현지시간) 차세대 멀티모달 모델 ‘제미나이’를 공개하며 이같이 소개했다. 제미나이는 문서와 이미지, 오디오, 영상 등을 분석하고 추론할 수 있도록 설계된 첫 번째 모델이다. 언...

2023.12.07 00:43
'챗GPT 대항마' 구글 제미나이 공개

구글이 차세대 대규모언어모델(LLM) ‘제미나이’를 전격 공개했다. 이미지, 영상, 음성 등을 인식하고 추론하는 멀티모달 기능을 전면에 내세웠다. 구글은 5일(현지시간) 온라인 미디어 브리핑을 통해 제미나이 출시를 알렸다. 이 회사는 제미나이를 처음부터 멀티모달로 설계했다고 강조했다. 단순히 이미지를 파악하는 것을 넘어서 물건의 속성과 특징까지 파악해 이를...

2023.12.07 00:41
LG AI 연구원, 이미지→텍스트로 바꿔주는 AI 서비스 내놨다

LG AI 연구원이 이미지를 텍스트로 바꿔주는 생성 인공지능(AI) 서비스를 내놨다. 이미지 데이터 관리와 시각장애인을 위한 시각 자료 해설 등에 이 서비스를 쓰기로 했다. 이 연구원은 아마존웹서비스(AWS)를 통해 생성 AI를 활용한 기업간거래(B2B) 솔루션을 외부...

2023.11.29 23:00
"성능은 높이고 가격은 낮췄다"…오픈AI, 'GPT-4터보' 공개

챗GPT를 개발한 오픈AI가 회사 창립 후 첫 번째 개발자 회의에서 성능을 한층 강화한 대규모언어모델(LLM) ‘GPT-4 터보’를 발표했다. 개발자가 챗봇을 목적에 맞게 커스터마이징할 수 있는 기능도 공개했다. 또한 회사와 개발자의 소프트웨어를 사용료도 낮춰 접근성을...

2023.11.07 04:45
머스크도 AI 챗봇 공개…빅테크 '가을 大戰'

일론 머스크가 설립한 xAI와 마이크로소프트(MS), 오픈AI 등 주요 테크 기업이 새로운 생성 인공지능(AI)으로 ‘가을 대전’에 나섰다. 작년 11월 오픈AI의 챗GPT가 등장한 뒤 1주년을 맞아 다양한 기술과 비즈니스 전략으로 점유율 경쟁에 나섰다. 특히 AI업계...

2023.11.05 17:53

/ 2

많이 본 뉴스