macsplex.com 로그인

검색

조회 수 124 추천 수 0 댓글 1
?

단축키

Prev이전 문서

Next다음 문서

위로 아래로 댓글로 가기 인쇄 첨부
Extra Form
출처/참고/홈페이지 https://www.superhuman.ai/p/startup-deli...i-podcasts
TAG •

Who's DNAVI

profile

안녕하세요 macsplex.com 웹마스터 DNAVI입니다.

오픈소스를 좋아하고 컴퓨터에서 돌아가는 OS와 소프트웨어를 설치하고 웹사이트를 운영하는데 관심이 많습니다.

 

가지고 있는 제품리스트

PC  :

homebuilt computer(Intel i7-4790K, ASUS MAXIMUS Ranger Vii, AMD Radeon R290),

homebuilt computer(AMD Phenom X4 630, GIGABYTE GA-61P-S3, NVIDIA GT8600),

Apple iMac 2009 late(Intel E7600)

Apple MacMini 2018(Intel i5-8500B, A1993)

homebuilt computer(AMD Ryzen 5700x3d, Asrock B450 Steel Legend, Intel A770)

Beelink SER 7 (AMD Ryzen 7840HS)

Firebat S1(Intel N100)

 

Notebook :

Acer Swift 14 AI 2024(Qualcomm SnapDragon X Plus X1P4200)

Apple Macbook Air 2022 (M2, A2681)

Lenovo LEGION 5 Pro 16ACH R7 STORM (AMD R7-5800H, NVIDIA RTX3060 laptop)

Lenovo Thinkpad T420s(Intel i5-2540M)

Apple Macbook Air 2011 Mid( i5-2467M, A1370)

 

Server :

Dell PowerEdge R420(Intel XEON E5-2407)

Dell PowerEdge R710(Intel XEON E5620 x2, 32GB)

HP Proliant Microserver Gen8(Intel XEON E3-1230V2)

 

NAS :

Synology.DS218+

BUFFALO LinkStation Live LS-XL/E

 

Smartphone:

Motorola Edge 20 pro

Apple iPhone 12

Apple iPhone 15 Pro Max

Samsung Galaxy S8

Xiaomi Redmi Note 4, Mi 8

Lenovo Phab2 Pro

Apple iPhone 5

Huawei X3, Nova Smart

Blackberry 9790

 

Tablet :

Apple iPad 9th gen

Apple iPad Air2

Samsung Galaxy Tab S7+

Lenovo Xiaoxin 2022

 

Game Console :

Sony PSP, PS3, PS4 Pro, PS5

Microsoft Xbox 360, Xbox One X

Nintendo DS Lite, 3DS XL, Switch Lite, Switch

HardKernel Odrid Go Advance Black Edition

Gamepark GP2X-F100

Valve Steam deck LCD

Atachment
첨부
  • profile

    **애플의 논문 Gemini2.5 pro preview로 요약한 내용입니다. 

    논문다운로드 : the-illusion-of-thinking.pdf

    다음은 "사고의 환상: 문제 복잡성 렌즈를 통해 본 추론 모델의 강점과 한계 이해" 논문을 요약한 내용입니다.

    핵심 요약
    이 논문은 OpenAI의 o1, Claude 3.7 Sonnet Thinking, DeepSeek-R1과 같은 최신 **대규모 추론 모델(LRM)**의 실제 추론 능력에 대해 체계적으로 분석합니다. 연구진은 기존의 수학/코딩 벤치마크가 데이터 오염 문제 등으로 인해 모델의 진정한 능력을 평가하기 어렵다고 주장하며, 대신 **복잡도를 정밀하게 조절할 수 있는 퍼즐 환경(하노이의 탑, 블록 월드 등)**을 사용했습니다. 이를 통해 모델의 최종 답변뿐만 아니라, "생각"하는 과정(reasoning trace)까지 심층적으로 분석했습니다.

    주요 연구 결과
    성능 붕괴와 역설적인 스케일링 한계:

    모든 LRM은 특정 복잡도 임계점을 넘어서면 정확도가 0%로 완전히 붕괴되는 현상을 보였습니다.

    더 흥미로운 점은, 문제 복잡도가 증가함에 따라 모델의 추론 노력(생성하는 '생각' 토큰 수)도 증가하다가, 성능 붕괴 지점에 가까워지면 오히려 감소하는 역설적인 스케일링 한계를 보였습니다. 이는 충분한 토큰 예산이 있어도 더 복잡한 문제에 대해 생각하기를 포기하는 것으로, LRM의 근본적인 한계를 시사합니다.

    세 가지 성능 구간 (일반 LLM vs. LRM):

    저복잡도 구간: 놀랍게도 '생각' 기능이 없는 일반 LLM이 LRM보다 더 정확하고 효율적이었습니다. LRM은 간단한 문제에 대해 불필요하게 많이 생각하는("과잉사고", overthinking) 경향을 보였습니다.

    중복잡도 구간: LRM의 '생각' 기능이 명확한 이점을 보이며 일반 LLM보다 높은 성능을 기록했습니다.

    고복잡도 구간: LRM과 일반 LLM 모두 성능이 완전히 붕괴되었습니다. LRM이 붕괴를 약간 지연시킬 뿐, 근본적인 한계는 동일했습니다.

    '생각' 과정 분석의 시사점:

    간단한 문제에서는 정답을 초반에 찾아내고도 불필요한 탐색을 계속하며 비효율성을 보였습니다.

    복잡한 문제에서는 정답에 도달하지 못하고 잘못된 경로만 탐색하다 실패했습니다.

    이는 모델의 자기 교정(self-correction) 능력에 명확한 한계가 있음을 보여줍니다.

    정확한 계산 능력의 한계:

    가장 놀라운 발견 중 하나로, 모델에게 퍼즐을 푸는 명시적인 알고리즘(예: 하노이의 탑 재귀 알고리즘)을 프롬프트에 제공해도 성능이 전혀 개선되지 않았습니다.

    이는 LRM이 단순히 문제 해결 전략을 짜는 것뿐만 아니라, 주어진 논리적 단계를 정확히 실행하는 능력 자체에 근본적인 약점이 있음을 의미합니다.

    결론
    이 논문은 현재의 LRM이 보여주는 '생각'이 진정한 의미의 일반화된 추론이라기보다는, 정교하지만 깨지기 쉬운 패턴 매칭의 한 형태일 수 있다는 **"사고의 환상"**을 제기합니다. LRM은 문제의 구성적 복잡도가 증가함에 따라 예측 가능하게 실패하며, 이는 단순히 계산 능력 부족이 아닌, 현재 접근법의 근본적인 장벽에 부딪히고 있음을 시사합니다.


List of Articles
분류 제목 글쓴이 날짜
유출/루머 16개의 Xe 코어와 2.45GHz 클럭을 갖춘 신비한 Intel Arc Desktop GPU가 표지를 장식합니다 file DNAVI 2023.01.26
MS 원도우즈 1월15일부터 새로운 엣지(edge)가 원도우10 업데이트 포함예정 file DNAVI 2020.01.13
2020년 IT 세미나,포럼,컨퍼런스,전시회 일정 3 DNAVI 2019.12.23
유출/루머 2025년 MacBook Pro는 터치가 가능한 OLED 화면으로 출시할수 있습니다. 1 DNAVI 2023.01.12
제품 230W 냉각 용량의 존스보 HX5230 타워형 CPU 쿨러 출시 file DNAVI 2023.03.06
업계동향 580 시리즈 드라이버 이후 NVIDIA Maxwell, Pascal 및 Volta 드라이버 지원 종료 file DNAVI 2025.07.02
유출/루머 8코어 AMD 라이젠 AI 맥스 프로 385 벤치마크, 저렴한 스트릭스 헤일로 APU 출시 임박 file DNAVI 2025.06.01
제품 AAEON, 세계 최소형 13세대 인텔 코어 기반 싱글 보드 출시 file DNAVI 2025.06.23
제품 Acer, NVIDIA GeForce RTX 50 시리즈 탑재한 창작자용 'Swift X Duo' 공개 file DNAVI 2025.05.18
제품 ADATA XPG SPECTRIX D60G DDR4 메모리 레드닷디자인상 수상 file DNAVI 2020.04.01
제품 ADATA, 플레이스테이션 5용 프리미어 4TB M.2 NVMe SSD 공개 file DNAVI 2023.02.15
제품 AMD CPU기반의 새로운 서피스 개발중입니다. file DNAVI 2020.03.20
유출/루머 AMD EPYC 제노아는 12채널 DDR5-5200 메모리를 지원합니다. file DNAVI 2021.12.13
제품 AMD Radeon RX 6700XT 레퍼런스 wccftech 리뷰 file DNAVI 2021.03.17
유출/루머 AMD Radeon RX 8800 XT는 3GHz이상으로 부스트되고, 4nm 공정에서 제조되는 Tensor 유닛을 지원합니다. file DNAVI 2024.02.12
업계동향 AMD Radeon RX 9070 시리즈, 최신 드라이버로 잠재력 발휘 newfile DNAVI 2025.07.03
제품 AMD RDNA3기반 RX 7000시리즈 그래픽카드 출시 file DNAVI 2022.11.07
제품 AMD Ryzen 7040 시리즈 "Phoenix Point" 모바일 프로세서 I/O 세부 정보 file DNAVI 2023.01.08
제품 AMD Ryzen 9000 데스크톱 CPU가 소켓 AM5에 효율적인 Zen 5 성능을 제공합니다 file DNAVI 2024.06.05
제품 AMD ZEN 3 공개 file DNAVI 2020.10.09
Board Pagination Prev 1 2 3 4 5 6 7 8 9 10 ... 12 Next
/ 12