macsplex.com 로그인

검색

조회 수 124 추천 수 0 댓글 1
?

단축키

Prev이전 문서

Next다음 문서

위로 아래로 댓글로 가기 인쇄 첨부
Extra Form
출처/참고/홈페이지 https://www.superhuman.ai/p/startup-deli...i-podcasts
TAG •

Who's DNAVI

profile

안녕하세요 macsplex.com 웹마스터 DNAVI입니다.

오픈소스를 좋아하고 컴퓨터에서 돌아가는 OS와 소프트웨어를 설치하고 웹사이트를 운영하는데 관심이 많습니다.

 

가지고 있는 제품리스트

PC  :

homebuilt computer(Intel i7-4790K, ASUS MAXIMUS Ranger Vii, AMD Radeon R290),

homebuilt computer(AMD Phenom X4 630, GIGABYTE GA-61P-S3, NVIDIA GT8600),

Apple iMac 2009 late(Intel E7600)

Apple MacMini 2018(Intel i5-8500B, A1993)

homebuilt computer(AMD Ryzen 5700x3d, Asrock B450 Steel Legend, Intel A770)

Beelink SER 7 (AMD Ryzen 7840HS)

Firebat S1(Intel N100)

 

Notebook :

Acer Swift 14 AI 2024(Qualcomm SnapDragon X Plus X1P4200)

Apple Macbook Air 2022 (M2, A2681)

Lenovo LEGION 5 Pro 16ACH R7 STORM (AMD R7-5800H, NVIDIA RTX3060 laptop)

Lenovo Thinkpad T420s(Intel i5-2540M)

Apple Macbook Air 2011 Mid( i5-2467M, A1370)

 

Server :

Dell PowerEdge R420(Intel XEON E5-2407)

Dell PowerEdge R710(Intel XEON E5620 x2, 32GB)

HP Proliant Microserver Gen8(Intel XEON E3-1230V2)

 

NAS :

Synology.DS218+

BUFFALO LinkStation Live LS-XL/E

 

Smartphone:

Motorola Edge 20 pro

Apple iPhone 12

Apple iPhone 15 Pro Max

Samsung Galaxy S8

Xiaomi Redmi Note 4, Mi 8

Lenovo Phab2 Pro

Apple iPhone 5

Huawei X3, Nova Smart

Blackberry 9790

 

Tablet :

Apple iPad 9th gen

Apple iPad Air2

Samsung Galaxy Tab S7+

Lenovo Xiaoxin 2022

 

Game Console :

Sony PSP, PS3, PS4 Pro, PS5

Microsoft Xbox 360, Xbox One X

Nintendo DS Lite, 3DS XL, Switch Lite, Switch

HardKernel Odrid Go Advance Black Edition

Gamepark GP2X-F100

Valve Steam deck LCD

Atachment
첨부
  • profile

    **애플의 논문 Gemini2.5 pro preview로 요약한 내용입니다. 

    논문다운로드 : the-illusion-of-thinking.pdf

    다음은 "사고의 환상: 문제 복잡성 렌즈를 통해 본 추론 모델의 강점과 한계 이해" 논문을 요약한 내용입니다.

    핵심 요약
    이 논문은 OpenAI의 o1, Claude 3.7 Sonnet Thinking, DeepSeek-R1과 같은 최신 **대규모 추론 모델(LRM)**의 실제 추론 능력에 대해 체계적으로 분석합니다. 연구진은 기존의 수학/코딩 벤치마크가 데이터 오염 문제 등으로 인해 모델의 진정한 능력을 평가하기 어렵다고 주장하며, 대신 **복잡도를 정밀하게 조절할 수 있는 퍼즐 환경(하노이의 탑, 블록 월드 등)**을 사용했습니다. 이를 통해 모델의 최종 답변뿐만 아니라, "생각"하는 과정(reasoning trace)까지 심층적으로 분석했습니다.

    주요 연구 결과
    성능 붕괴와 역설적인 스케일링 한계:

    모든 LRM은 특정 복잡도 임계점을 넘어서면 정확도가 0%로 완전히 붕괴되는 현상을 보였습니다.

    더 흥미로운 점은, 문제 복잡도가 증가함에 따라 모델의 추론 노력(생성하는 '생각' 토큰 수)도 증가하다가, 성능 붕괴 지점에 가까워지면 오히려 감소하는 역설적인 스케일링 한계를 보였습니다. 이는 충분한 토큰 예산이 있어도 더 복잡한 문제에 대해 생각하기를 포기하는 것으로, LRM의 근본적인 한계를 시사합니다.

    세 가지 성능 구간 (일반 LLM vs. LRM):

    저복잡도 구간: 놀랍게도 '생각' 기능이 없는 일반 LLM이 LRM보다 더 정확하고 효율적이었습니다. LRM은 간단한 문제에 대해 불필요하게 많이 생각하는("과잉사고", overthinking) 경향을 보였습니다.

    중복잡도 구간: LRM의 '생각' 기능이 명확한 이점을 보이며 일반 LLM보다 높은 성능을 기록했습니다.

    고복잡도 구간: LRM과 일반 LLM 모두 성능이 완전히 붕괴되었습니다. LRM이 붕괴를 약간 지연시킬 뿐, 근본적인 한계는 동일했습니다.

    '생각' 과정 분석의 시사점:

    간단한 문제에서는 정답을 초반에 찾아내고도 불필요한 탐색을 계속하며 비효율성을 보였습니다.

    복잡한 문제에서는 정답에 도달하지 못하고 잘못된 경로만 탐색하다 실패했습니다.

    이는 모델의 자기 교정(self-correction) 능력에 명확한 한계가 있음을 보여줍니다.

    정확한 계산 능력의 한계:

    가장 놀라운 발견 중 하나로, 모델에게 퍼즐을 푸는 명시적인 알고리즘(예: 하노이의 탑 재귀 알고리즘)을 프롬프트에 제공해도 성능이 전혀 개선되지 않았습니다.

    이는 LRM이 단순히 문제 해결 전략을 짜는 것뿐만 아니라, 주어진 논리적 단계를 정확히 실행하는 능력 자체에 근본적인 약점이 있음을 의미합니다.

    결론
    이 논문은 현재의 LRM이 보여주는 '생각'이 진정한 의미의 일반화된 추론이라기보다는, 정교하지만 깨지기 쉬운 패턴 매칭의 한 형태일 수 있다는 **"사고의 환상"**을 제기합니다. LRM은 문제의 구성적 복잡도가 증가함에 따라 예측 가능하게 실패하며, 이는 단순히 계산 능력 부족이 아닌, 현재 접근법의 근본적인 장벽에 부딪히고 있음을 시사합니다.


  1. PS5 Pro, 2026년 대폭 업그레이드 예정 – 마크 세르니 인터뷰: AMD 미래 GPU, 플레이스테이션과 더욱 가까워지다

  2. AMD Radeon RX 9070 시리즈, 최신 드라이버로 잠재력 발휘

  3. 580 시리즈 드라이버 이후 NVIDIA Maxwell, Pascal 및 Volta 드라이버 지원 종료

  4. PNG 이미지 형식, 버전 3.0에서 네이티브 애니메이션 및 HDR 지원

  5. NVIDIA의 새로운 DLSS Transformer 모델은 VRAM 사용량이 20% 더 적게 필요합니다.

  6. 인텔 Core Ultra 7 265KF CPU, 229로가격인하

  7. Intel Arc Alchemist A750 생산 종료 안내

  8. 애플 연구원들은 AI를 '추론'이라고 부릅니다

  9. 모든 투자자를 위한 답변

  10. Asus, 봇넷에 의해 침해된 9,000대 이상의 라우터에 대한 우려에 대응

  11. 딥시크의 증류된 새로운 R1 AI 모델은 단일 GPU에서 실행할 수 있습니다

  12. MSI의 "실수 방지용" 노란색 팁 GPU 커넥터에도 불구하고 또 다른 엔비디아 RTX 5090 케이블이 녹았습니다.

  13. 새로운 80 Plus 루비 PSU 효율 등급이 티타늄 표준을 초과하여 데이터 센터에 출시되었습니다

  14. 애플, 애플워치 혈중 산소 기능 제거를 강조하기 위해 웹 사이트 업데이트

  15. Microsoft, 코파일럿 및 Windows AI 기능의 최소 요구 사양으로 16GB RAM 설정

  16. Microsoft는 수천 개의 Nvidia GPU가 어떻게 ChatGPT를 구축했는지 설명합니다

Board Pagination Prev 1 Next
/ 1