macsplex.com 로그인

검색

조회 수 118 추천 수 0 댓글 1
?

단축키

Prev이전 문서

Next다음 문서

위로 아래로 댓글로 가기 인쇄 첨부
Extra Form
출처/참고/홈페이지 https://www.superhuman.ai/p/startup-deli...i-podcasts
TAG •

Who's DNAVI

profile

안녕하세요 macsplex.com 웹마스터 DNAVI입니다.

오픈소스를 좋아하고 컴퓨터에서 돌아가는 OS와 소프트웨어를 설치하고 웹사이트를 운영하는데 관심이 많습니다.

 

가지고 있는 제품리스트

PC  :

homebuilt computer(Intel i7-4790K, ASUS MAXIMUS Ranger Vii, AMD Radeon R290),

homebuilt computer(AMD Phenom X4 630, GIGABYTE GA-61P-S3, NVIDIA GT8600),

Apple iMac 2009 late(Intel E7600)

Apple MacMini 2018(Intel i5-8500B, A1993)

homebuilt computer(AMD Ryzen 5700x3d, Asrock B450 Steel Legend, Intel A770)

Beelink SER 7 (AMD Ryzen 7840HS)

Firebat S1(Intel N100)

 

Notebook :

Acer Swift 14 AI 2024(Qualcomm SnapDragon X Plus X1P4200)

Apple Macbook Air 2022 (M2, A2681)

Lenovo LEGION 5 Pro 16ACH R7 STORM (AMD R7-5800H, NVIDIA RTX3060 laptop)

Lenovo Thinkpad T420s(Intel i5-2540M)

Apple Macbook Air 2011 Mid( i5-2467M, A1370)

 

Server :

Dell PowerEdge R420(Intel XEON E5-2407)

Dell PowerEdge R710(Intel XEON E5620 x2, 32GB)

HP Proliant Microserver Gen8(Intel XEON E3-1230V2)

 

NAS :

Synology.DS218+

BUFFALO LinkStation Live LS-XL/E

 

Smartphone:

Motorola Edge 20 pro

Apple iPhone 12

Apple iPhone 15 Pro Max

Samsung Galaxy S8

Xiaomi Redmi Note 4, Mi 8

Lenovo Phab2 Pro

Apple iPhone 5

Huawei X3, Nova Smart

Blackberry 9790

 

Tablet :

Apple iPad 9th gen

Apple iPad Air2

Samsung Galaxy Tab S7+

Lenovo Xiaoxin 2022

 

Game Console :

Sony PSP, PS3, PS4 Pro, PS5

Microsoft Xbox 360, Xbox One X

Nintendo DS Lite, 3DS XL, Switch Lite, Switch

HardKernel Odrid Go Advance Black Edition

Gamepark GP2X-F100

Valve Steam deck LCD

Atachment
첨부
  • profile

    **애플의 논문 Gemini2.5 pro preview로 요약한 내용입니다. 

    논문다운로드 : the-illusion-of-thinking.pdf

    다음은 "사고의 환상: 문제 복잡성 렌즈를 통해 본 추론 모델의 강점과 한계 이해" 논문을 요약한 내용입니다.

    핵심 요약
    이 논문은 OpenAI의 o1, Claude 3.7 Sonnet Thinking, DeepSeek-R1과 같은 최신 **대규모 추론 모델(LRM)**의 실제 추론 능력에 대해 체계적으로 분석합니다. 연구진은 기존의 수학/코딩 벤치마크가 데이터 오염 문제 등으로 인해 모델의 진정한 능력을 평가하기 어렵다고 주장하며, 대신 **복잡도를 정밀하게 조절할 수 있는 퍼즐 환경(하노이의 탑, 블록 월드 등)**을 사용했습니다. 이를 통해 모델의 최종 답변뿐만 아니라, "생각"하는 과정(reasoning trace)까지 심층적으로 분석했습니다.

    주요 연구 결과
    성능 붕괴와 역설적인 스케일링 한계:

    모든 LRM은 특정 복잡도 임계점을 넘어서면 정확도가 0%로 완전히 붕괴되는 현상을 보였습니다.

    더 흥미로운 점은, 문제 복잡도가 증가함에 따라 모델의 추론 노력(생성하는 '생각' 토큰 수)도 증가하다가, 성능 붕괴 지점에 가까워지면 오히려 감소하는 역설적인 스케일링 한계를 보였습니다. 이는 충분한 토큰 예산이 있어도 더 복잡한 문제에 대해 생각하기를 포기하는 것으로, LRM의 근본적인 한계를 시사합니다.

    세 가지 성능 구간 (일반 LLM vs. LRM):

    저복잡도 구간: 놀랍게도 '생각' 기능이 없는 일반 LLM이 LRM보다 더 정확하고 효율적이었습니다. LRM은 간단한 문제에 대해 불필요하게 많이 생각하는("과잉사고", overthinking) 경향을 보였습니다.

    중복잡도 구간: LRM의 '생각' 기능이 명확한 이점을 보이며 일반 LLM보다 높은 성능을 기록했습니다.

    고복잡도 구간: LRM과 일반 LLM 모두 성능이 완전히 붕괴되었습니다. LRM이 붕괴를 약간 지연시킬 뿐, 근본적인 한계는 동일했습니다.

    '생각' 과정 분석의 시사점:

    간단한 문제에서는 정답을 초반에 찾아내고도 불필요한 탐색을 계속하며 비효율성을 보였습니다.

    복잡한 문제에서는 정답에 도달하지 못하고 잘못된 경로만 탐색하다 실패했습니다.

    이는 모델의 자기 교정(self-correction) 능력에 명확한 한계가 있음을 보여줍니다.

    정확한 계산 능력의 한계:

    가장 놀라운 발견 중 하나로, 모델에게 퍼즐을 푸는 명시적인 알고리즘(예: 하노이의 탑 재귀 알고리즘)을 프롬프트에 제공해도 성능이 전혀 개선되지 않았습니다.

    이는 LRM이 단순히 문제 해결 전략을 짜는 것뿐만 아니라, 주어진 논리적 단계를 정확히 실행하는 능력 자체에 근본적인 약점이 있음을 의미합니다.

    결론
    이 논문은 현재의 LRM이 보여주는 '생각'이 진정한 의미의 일반화된 추론이라기보다는, 정교하지만 깨지기 쉬운 패턴 매칭의 한 형태일 수 있다는 **"사고의 환상"**을 제기합니다. LRM은 문제의 구성적 복잡도가 증가함에 따라 예측 가능하게 실패하며, 이는 단순히 계산 능력 부족이 아닌, 현재 접근법의 근본적인 장벽에 부딪히고 있음을 시사합니다.


  1. 슈퍼마이크로, AMD Instinct MI350 시리즈 GPU 및 플랫폼과 함께 액체 냉각 및 공기 냉각 AI 솔루션을 제공

    Date2025.06.13 Category :제품 DNAVI
    Read More
  2. AMD, EPYC "베니스(Venice)" Zen 6 및 EPYC "베라노(Verano)" Zen 7 서버 프로세서 언급

    Date2025.06.13 Category :제품 DNAVI
    Read More
  3. MSI IPC의 MS-CF23: 주변 시스템 최적화된 Intel Arrow Lake-S 및 H810 허칭을 갖춘 Mini-ITX 모더보드

    Date2025.06.13 Category :제품 DNAVI
    Read More
  4. AMD, 첫 번째 울트라 이더넷(Ultra Ethernet) 지원 네트워크 카드 배포 - 펜산도 폴라라(Pensando Pollara)는 최대 400Gbps 성능 제공

    Date2025.06.13 Category :유출/루머 DNAVI
    Read More
  5. Cisco, 보안 네트워크 아키텍처 공개: 스마트 스위치, 보안 라우터 및 WiFi7 액세스 포인트 출시

    Date2025.06.11 Category :제품 DNAVI
    Read More
  6. MSI는 2025년 ISC에서 AI의 다음 단계로 나아갑니다

    Date2025.06.11 Category :제품 DNAVI
    Read More
  7. 레노버, 새로운 워크스테이션 솔루션 및 ThinkStation 데스크탑 포트폴리오 업데이트 발표

    Date2025.06.11 Category :제품 DNAVI
    Read More
  8. iOS 26이라고 불리는 이유는? 아이폰 iOS 19는 어떻게 된 건가요?

    Date2025.06.10 Category :Apple DNAVI
    Read More
  9. 캐노니컬, 우분투 25.10에서 X.Org 기반 GNOME 지원 중단 확인

    Date2025.06.10 Category :Linux DNAVI
    Read More
  10. be quiet! ATX 3.1 파워 서플라이 'Pure Power 13 M' 라인 발표

    Date2025.06.10 Category :제품 DNAVI
    Read More
  11. NVIDIA N1X 20코어 CPU 성능 유출, 고급형 야심 드러내

    Date2025.06.10 Category :유출/루머 DNAVI
    Read More
  12. ASRock Industrial, Intel Core 200S 프로세서 기반 새로운 산업용 마더보드 출시

    Date2025.06.10 Category :제품 DNAVI
    Read More
  13. AYANEO, AMD Ryzen AI 9 HX 370을 탑재한 FLIP 1S 듀얼 스크린 게이밍 핸드헬드 출시

    Date2025.06.10 Category :제품 DNAVI
    Read More
  14. 애플의 macOS 26 "타호", 부유하는 투명 "리퀴드 글래스" UI 도입

    Date2025.06.10 Category :Apple DNAVI
    Read More
  15. 애플 연구원들은 AI를 '추론'이라고 부릅니다

    Date2025.06.09 Category :업계동향 DNAVI Reply1
    Read More
  16. 모든 투자자를 위한 답변

    Date2025.06.08 Category :업계동향 DNAVI Reply1
    Read More
  17. highpoint가 $999에 산업 최초의 Gen5 NVMe RAID AIC를 발표

    Date2025.06.08 Category :제품 DNAVI
    Read More
  18. ASUS가 최강의 게이밍 라우터를 공개했습니다: ROG Strix GS-BE18000 Wi-Fi 7 Gaming Router

    Date2025.06.08 Category :제품 DNAVI
    Read More
  19. Asus, 봇넷에 의해 침해된 9,000대 이상의 라우터에 대한 우려에 대응

    Date2025.06.05 Category :업계동향 DNAVI Reply1
    Read More
  20. Colorful, Strix Halo로 Mini-PC 제품군 확장

    Date2025.06.05 Category :제품 DNAVI
    Read More
Board Pagination Prev 1 2 3 4 5 6 7 8 9 10 11 Next
/ 11