제품

뭐라고요? RTX와의 채팅으로 엔비디아 RTX AI PC에 맞춤형 챗봇 제공

by DNAVI posted Feb 16, 2024
?

단축키

Prev이전 문서

Next다음 문서

ESC닫기

크게 작게 위로 아래로 게시글 수정 내역 댓글로 가기 인쇄
Extra Form
출처/참고/홈페이지 https://blogs.nvidia.com/blog/chat-with-rtx-available-now/

nvidia-chatwithrtx-ss.png

**번역본 뉴스입니다. 오역이 있을수 있습니다.
테크 데모는 RTX GPU를 가진 모든 사람에게 개인화된 GPT 챗봇의 힘을 제공합니다.

 

공유해요

 

챗봇은 엔비디아 GPU 기반 클라우드 서버에 의해 구동되는, 매일 전세계의 수백만 명의 사람들에 의해 사용됩니다. 이제, 이 획기적인 도구들은 로컬의, 빠른, 맞춤형 생성 AI를 위해 엔비디아 RTX에 의해 구동되는 윈도우 PC로 오고 있습니다.

이제 무료로 다운로드할 수 있는 RTX와의 채팅은 최소 8GB의 비디오 랜덤 액세스 메모리, 즉 VRAM을 갖춘 로컬 NVIDIA GeForce RTX 30 Series GPU 이상으로 가속화된 챗봇을 사용자 자신의 콘텐츠로 개인화할 수 있는 기술 데모입니다.


뭐든 물어봐요.

 

RTX와의 대화는 검색-증강 세대 (RAG), NVIDIA Tensor RT-LLM 소프트웨어 및 NVIDIA RTX 가속을 사용하여 생성 AI 기능을 GeForce 기반 로컬 Windows PC에 제공합니다. 사용자는 PC의 로컬 파일을 데이터 세트로 된 Mistral 또는 Lama 2와 같은 오픈 소스 대규모 언어 모델에 빠르고 쉽게 연결할 수 있으며, 이를 통해 상황에 따라 관련된 빠른 답변을 위한 쿼리를 가능하게 합니다.

노트나 저장된 콘텐츠를 검색하는 대신, 사용자들은 단순히 쿼리를 입력할 수 있습니다. 예를 들어, "라스베가스에 있는 동안 파트너가 추천한 레스토랑은 무엇이었습니까?"라고 물을 수 있고, RTX와의 채팅은 사용자가 가리키는 로컬 파일을 스캔하고 컨텍스트와 함께 답변을 제공합니다.

이 도구는 .txt, .pdf, .doc/.docx 및 .xml을 포함한 다양한 파일 형식을 지원합니다. 이 파일들이 들어 있는 폴더에서 응용 프로그램을 가리키면 이 도구는 몇 초 만에 라이브러리에 파일을 로드합니다.

 

사용자는 또한 유튜브 비디오 및 재생 목록의 정보를 포함할 수 있습니다. RTX와의 채팅에 비디오 URL을 추가하면 상황별 쿼리를 위해 이 지식을 챗봇에 통합할 수 있습니다. 예를 들어, 좋아하는 인플루언서 비디오의 내용을 기반으로 여행 추천을 요청하거나 최고의 교육 리소스를 기반으로 빠른 튜토리얼과 사용 방법을 얻을 수 있습니다.

 

Chat-with-RTX-Screenshot-672x378.jpg.webp.jpg

RTX와의 대화는 윈도우 RTX PC와 워크스테이션에서 로컬로 실행되기 때문에 제공되는 결과는 빠르고 사용자의 데이터는 기기에 유지됩니다. 클라우드 기반의 LLM 서비스에 의존하는 대신, RTX와의 대화는 사용자가 민감한 데이터를 제3자와 공유하거나 인터넷에 연결할 필요 없이 로컬 PC에서 처리할 수 있게 해줍니다.

 

최소 8GB 이상의 VRAM을 갖춘 GeForce RTX 30 시리즈 GPU 외에도 RTX와의 채팅을 위해서는 Windows 10 또는 11과 최신 NVIDIA GPU 드라이버가 필요합니다.

 

편집자 참고: RTX와의 채팅에서 사용자가 다른 설치 디렉토리를 선택할 때 설치가 실패하는 문제를 확인했습니다. 이 문제는 향후 릴리스에서 수정될 예정입니다. 당분간 사용자는 기본 설치 디렉토리("C:\Users\<username>\AppData\Local\NVIDIA\ChatWithRTX")를 사용해야 합니다.


RTX를 이용한 LLM 기반 애플리케이션 개발

RTX와의 채팅은 RTX GPU로 LLM을 가속화할 수 있는 가능성을 보여줍니다. 앱은 GitHub에서 사용할 수 있는 TensorRT-LLM RAG 개발자 참조 프로젝트에서 구축되었습니다. 개발자는 참조 프로젝트를 사용하여 TensorRT-LLM으로 가속화된 RTX용 RAG 기반 애플리케이션을 개발하고 배포할 수 있습니다. LLM 기반 애플리케이션 구축에 대해 자세히 알아보십시오.

 

https://www.nvidia.com/en-us/ai-data-science/generative-ai/

https://www.nvidia.com/en-us/ai-on-rtx/





--------------------------------------------------광고(Advertising)-------------------------------------------------------------------------------------


TAG •

Who's DNAVI

profile

안녕하세요 macsplex.com 웹마스터 DNAVI입니다.

오픈소스를 좋아하고 컴퓨터에서 돌아가는 OS와 소프트웨어를 설치하고 웹사이트를 운영하는데 관심이 많습니다.

 

가지고 있는 제품리스트

PC  :

homebuilt computer(Intel i7-4790K, ASUS MAXIMUS Ranger Vii, AMD Radeon R290),

homebuilt computer(AMD Phenom X4 630, GIGABYTE GA-61P-S3, NVIDIA GT8600),

Apple iMac 2009 late(Intel E7600)

Apple MacMini 2018(Intel i5-8500B, A1993)

homebuilt computer(AMD Ryzen 5700x3d, Asrock B450 Steel Legend, Intel A770)

Beelink SER 7 (AMD Ryzen 7840HS)

Firebat S1(Intel N100)

 

Notebook :

Apple Macbook Air 2022 (M2, A2681)

Lenovo LEGION 5 Pro 16ACH R7 STORM (AMD R7-5800H, NVIDIA RTX3060 laptop)

Lenovo Thinkpad T420s(Intel i5-2540M)

Apple Macbook Air 2011 Mid( i5-2467M, A1370)

 

Server :

Dell PowerEdge R420(Intel XEON E5-2407)

Dell PowerEdge R710(Intel XEON E5620 x2, 32GB)

HP Proliant Microserver Gen8(Intel XEON E3-1230V2)

 

NAS :

Synology.DS218+

BUFFALO LinkStation Live LS-XL/E

 

Smartphone:

Motorola Edge 20 pro

Apple iPhone 12

Apple iPhone 15 Pro Max

Samsung Galaxy S8

Xiaomi Redmi Note 4, Mi 8

Lenovo Phab2 Pro

Apple iPhone 5

Huawei X3, Nova Smart

Blackberry 9790

 

Tablet :

Apple iPad 9th gen

Apple iPad Air2

Samsung Galaxy Tab S7+

Lenovo Xiaoxin 2022

 

Game Console :

Sony PSP, PS3, PS4 Pro, PS5

Microsoft Xbox 360, Xbox One X

Nintendo DS Lite, 3DS XL, Switch Lite, Switch

HardKernel Odrid Go Advance Black Edition

Gamepark GP2X-F100

Valve Steam deck LCD