macsplex.com 로그인

검색

조회 수 7 추천 수 0 댓글 1
?

단축키

Prev이전 문서

Next다음 문서

위로 아래로 댓글로 가기 인쇄 첨부
Extra Form
출처/참고/홈페이지 https://www.superhuman.ai/p/startup-deli...i-podcasts
TAG •

Who's DNAVI

profile

안녕하세요 macsplex.com 웹마스터 DNAVI입니다.

오픈소스를 좋아하고 컴퓨터에서 돌아가는 OS와 소프트웨어를 설치하고 웹사이트를 운영하는데 관심이 많습니다.

 

가지고 있는 제품리스트

PC  :

homebuilt computer(Intel i7-4790K, ASUS MAXIMUS Ranger Vii, AMD Radeon R290),

homebuilt computer(AMD Phenom X4 630, GIGABYTE GA-61P-S3, NVIDIA GT8600),

Apple iMac 2009 late(Intel E7600)

Apple MacMini 2018(Intel i5-8500B, A1993)

homebuilt computer(AMD Ryzen 5700x3d, Asrock B450 Steel Legend, Intel A770)

Beelink SER 7 (AMD Ryzen 7840HS)

Firebat S1(Intel N100)

 

Notebook :

Acer Swift 14 AI 2024(Qualcomm SnapDragon X Plus X1P4200)

Apple Macbook Air 2022 (M2, A2681)

Lenovo LEGION 5 Pro 16ACH R7 STORM (AMD R7-5800H, NVIDIA RTX3060 laptop)

Lenovo Thinkpad T420s(Intel i5-2540M)

Apple Macbook Air 2011 Mid( i5-2467M, A1370)

 

Server :

Dell PowerEdge R420(Intel XEON E5-2407)

Dell PowerEdge R710(Intel XEON E5620 x2, 32GB)

HP Proliant Microserver Gen8(Intel XEON E3-1230V2)

 

NAS :

Synology.DS218+

BUFFALO LinkStation Live LS-XL/E

 

Smartphone:

Motorola Edge 20 pro

Apple iPhone 12

Apple iPhone 15 Pro Max

Samsung Galaxy S8

Xiaomi Redmi Note 4, Mi 8

Lenovo Phab2 Pro

Apple iPhone 5

Huawei X3, Nova Smart

Blackberry 9790

 

Tablet :

Apple iPad 9th gen

Apple iPad Air2

Samsung Galaxy Tab S7+

Lenovo Xiaoxin 2022

 

Game Console :

Sony PSP, PS3, PS4 Pro, PS5

Microsoft Xbox 360, Xbox One X

Nintendo DS Lite, 3DS XL, Switch Lite, Switch

HardKernel Odrid Go Advance Black Edition

Gamepark GP2X-F100

Valve Steam deck LCD

Atachment
첨부
  • profile

    **애플의 논문 Gemini2.5 pro preview로 요약한 내용입니다. 

    논문다운로드 : the-illusion-of-thinking.pdf

    다음은 "사고의 환상: 문제 복잡성 렌즈를 통해 본 추론 모델의 강점과 한계 이해" 논문을 요약한 내용입니다.

    핵심 요약
    이 논문은 OpenAI의 o1, Claude 3.7 Sonnet Thinking, DeepSeek-R1과 같은 최신 **대규모 추론 모델(LRM)**의 실제 추론 능력에 대해 체계적으로 분석합니다. 연구진은 기존의 수학/코딩 벤치마크가 데이터 오염 문제 등으로 인해 모델의 진정한 능력을 평가하기 어렵다고 주장하며, 대신 **복잡도를 정밀하게 조절할 수 있는 퍼즐 환경(하노이의 탑, 블록 월드 등)**을 사용했습니다. 이를 통해 모델의 최종 답변뿐만 아니라, "생각"하는 과정(reasoning trace)까지 심층적으로 분석했습니다.

    주요 연구 결과
    성능 붕괴와 역설적인 스케일링 한계:

    모든 LRM은 특정 복잡도 임계점을 넘어서면 정확도가 0%로 완전히 붕괴되는 현상을 보였습니다.

    더 흥미로운 점은, 문제 복잡도가 증가함에 따라 모델의 추론 노력(생성하는 '생각' 토큰 수)도 증가하다가, 성능 붕괴 지점에 가까워지면 오히려 감소하는 역설적인 스케일링 한계를 보였습니다. 이는 충분한 토큰 예산이 있어도 더 복잡한 문제에 대해 생각하기를 포기하는 것으로, LRM의 근본적인 한계를 시사합니다.

    세 가지 성능 구간 (일반 LLM vs. LRM):

    저복잡도 구간: 놀랍게도 '생각' 기능이 없는 일반 LLM이 LRM보다 더 정확하고 효율적이었습니다. LRM은 간단한 문제에 대해 불필요하게 많이 생각하는("과잉사고", overthinking) 경향을 보였습니다.

    중복잡도 구간: LRM의 '생각' 기능이 명확한 이점을 보이며 일반 LLM보다 높은 성능을 기록했습니다.

    고복잡도 구간: LRM과 일반 LLM 모두 성능이 완전히 붕괴되었습니다. LRM이 붕괴를 약간 지연시킬 뿐, 근본적인 한계는 동일했습니다.

    '생각' 과정 분석의 시사점:

    간단한 문제에서는 정답을 초반에 찾아내고도 불필요한 탐색을 계속하며 비효율성을 보였습니다.

    복잡한 문제에서는 정답에 도달하지 못하고 잘못된 경로만 탐색하다 실패했습니다.

    이는 모델의 자기 교정(self-correction) 능력에 명확한 한계가 있음을 보여줍니다.

    정확한 계산 능력의 한계:

    가장 놀라운 발견 중 하나로, 모델에게 퍼즐을 푸는 명시적인 알고리즘(예: 하노이의 탑 재귀 알고리즘)을 프롬프트에 제공해도 성능이 전혀 개선되지 않았습니다.

    이는 LRM이 단순히 문제 해결 전략을 짜는 것뿐만 아니라, 주어진 논리적 단계를 정확히 실행하는 능력 자체에 근본적인 약점이 있음을 의미합니다.

    결론
    이 논문은 현재의 LRM이 보여주는 '생각'이 진정한 의미의 일반화된 추론이라기보다는, 정교하지만 깨지기 쉬운 패턴 매칭의 한 형태일 수 있다는 **"사고의 환상"**을 제기합니다. LRM은 문제의 구성적 복잡도가 증가함에 따라 예측 가능하게 실패하며, 이는 단순히 계산 능력 부족이 아닌, 현재 접근법의 근본적인 장벽에 부딪히고 있음을 시사합니다.


List of Articles
분류 제목 글쓴이 날짜
업계동향 애플 연구원들은 AI를 '추론'이라고 부릅니다 1 newfile DNAVI 2025.06.09
업계동향 모든 투자자를 위한 답변 1 file DNAVI 2025.06.08
제품 highpoint가 $999에 산업 최초의 Gen5 NVMe RAID AIC를 발표 file DNAVI 2025.06.08
제품 ASUS가 최강의 게이밍 라우터를 공개했습니다: ROG Strix GS-BE18000 Wi-Fi 7 Gaming Router file DNAVI 2025.06.08
업계동향 Asus, 봇넷에 의해 침해된 9,000대 이상의 라우터에 대한 우려에 대응 1 file DNAVI 2025.06.05
제품 Colorful, Strix Halo로 Mini-PC 제품군 확장 file DNAVI 2025.06.05
Linux Rocky Linux 9.6 다운로드 가능, Red Hat Enterprise Linux 9.6 기반으로 출시 1 file DNAVI 2025.06.05
제품 MSI, 소형 게이밍 PC 위한 ITX 지포스 RTX 5060 공개 file DNAVI 2025.06.04
제품 LG, 썬더볼트 5가 탑재된 울트라파인 40WT95UF 40인치 모니터 공개 file DNAVI 2025.06.04
업계동향 딥시크의 증류된 새로운 R1 AI 모델은 단일 GPU에서 실행할 수 있습니다 DNAVI 2025.06.01
MS 원도우즈 Windows에서 앱 업데이트를 위한 통합된 미래를 소개합니다 1 DNAVI 2025.06.01
유출/루머 8코어 AMD 라이젠 AI 맥스 프로 385 벤치마크, 저렴한 스트릭스 헤일로 APU 출시 임박 file DNAVI 2025.06.01
MS 원도우즈 Windows ML 소개: Windows에서 머신 러닝 개발의 미래 file DNAVI 2025.05.28
업계동향 MSI의 "실수 방지용" 노란색 팁 GPU 커넥터에도 불구하고 또 다른 엔비디아 RTX 5090 케이블이 녹았습니다. file DNAVI 2025.05.28
제품 MSI, 새로운 MAG 전원 공급 장치 출시 file DNAVI 2025.05.28
제품 D-Link, 새로운 DBR 라우터 및 액세스 포인트 출시 file DNAVI 2025.05.28
업계동향 새로운 80 Plus 루비 PSU 효율 등급이 티타늄 표준을 초과하여 데이터 센터에 출시되었습니다 file DNAVI 2025.05.28
제품 기가바이트, 자체 맞춤형 NVIDIA "DGX 스파크" 미니 AI 슈퍼컴퓨터 'AI TOP ATOM' 공개: 무려 1,000 TOPS의 AI 성능 제공 file DNAVI 2025.05.24
제품 미니스포럼, 컴퓨텍스 2025에서 곧 출시될 AMD 기반 NAS 공개 file DNAVI 2025.05.24
제품 AMD 라이젠 스레드리퍼 9000 "젠 5" CPU 공식 발표: DIY 및 워크스테이션용으로 최대 96코어, 5.4GHz 클럭, 384MB L3 캐시 탑재 file DNAVI 2025.05.24
Board Pagination Prev 1 2 3 4 5 6 7 8 9 Next
/ 9