
Image by TechCrunch, from Flickr
AI ที่คิดก่อนที่จะพูด? Claude 3.7 Sonnet เปิดตัว Hybrid Reasoning
Anthropic ได้เปิดตัว Claude 3.7 Sonnet ซึ่งเป็นเวอร์ชั่นใหม่ของโมเดล AI ที่นำเสนอโหมด “การคิดขยาย” ที่เป็นออปชันเพิ่มเติม ทำให้ผู้ใช้มีการควบคุมที่มากขึ้นเกี่ยวกับวิธีที่โมเดลประมวลผลงานที่ซับซ้อน
รีบไปไหน? นี่คือข้อเท็จจริงที่คุณต้องรู้!
- โมเดลช่วยปรับปรุงการตัดสินใจและการแก้ปัญหาด้วยการอนุญาตให้ตระหนักถึงตัวเองก่อนที่จะตอบคำถาม.
- โหมดการคิดที่ขยายขอบเขตนี้สามารถใช้งานได้เฉพาะในแผนการชำระเงินเท่านั้น.
- Claude Code, ผู้ช่วยในการเขียนโค้ด, อยู่ในระยะการแสดงตัวอย่างจำกัดสำหรับนักพัฒนา
Anthropic ได้ปล่อย Claude 3.7 Sonnet ซึ่งเป็นโมเดล AI ที่ได้รับการอัปเดต โดยแนะนำการใช้เหตุผลแบบผสม ทำให้ผู้ใช้สามารถเลือกระหว่างการตอบสนองอย่างรวดเร็ว และการคิดหนักๆ
วิธีการใหม่นี้มุ่งหมายที่จะปรับปรุงการแก้ปัญหาโดยการให้โมเดลมีเวลาเพิ่มเติมในการประเมินและปรับปรุงคำตอบของมันเมื่อจำเป็น
ในโหมดมาตรฐาน, Claude 3.7 Sonnet ทำงานเป็นการปรับปรุงที่ต่อเนื่องจากลายเซ็นที่เก่ากว่าของมัน, Claude 3.5 Sonnet แต่ในโหมดคิดค้นที่ขยายออก, โมเดลจะทำการสะท้อนความคิดของตนเองก่อนที่จะสร้างคำตอบออกมา
ไมเคิล เกอร์สเทนฮาเบอร์, ผู้นำทีมผลิตภัณฑ์ AI ของ Anthropic, ได้บรรยายถึงฟีเจอร์นี้ว่าเป็นวิธีให้ผู้ใช้สามารถควบคุมความสมดุลระหว่างเวลาตอบสนองและความลึกของการตัดสินใจได้ “ผู้ใช้[user]มีสิทธิ์ควบคุมพฤติกรรมได้เยอะ—เท่าไหร่ที่มันคิด, และสามารถเทรดความเข้าใจและความฉลาดกับเวลาและงบประมาณ” เขากล่าว, ดังที่รายงานโดย WIRED.
กระบวนการนี้มีจุดประสงค์เพื่อเพิ่มความแม่นยำในบริเวณที่ต้องการการวิเคราะห์หลายขั้นตอน เช่น คณิตศาสตร์, ฟิสิกส์, การเขียนโค้ด, และการปฏิบัติตามคำสั่ง. ผู้ใช้ที่มีการโต้ตอบกับโมเดลผ่านทาง API สามารถระบุขีดจำกัดเกี่ยวกับจำนวนโทเค็นที่ใช้ในการ “คิด”, อนุญาตให้ควบคุมความเร็วในการตอบสนองและต้นทุน.
WIRED บันทึกว่า การอัปเดตยังรวมคุณสมบัติ “scratchpad” ด้วย ซึ่งทำให้เห็นขั้นตอนการตัดสินใจของโมเดลขณะที่มันกำลังประมวลผลคำขอ วิธีการนี้คล้ายคลึงกับเทคนิคที่ใช้ในโมเดล AI อื่นๆ เช่น DeepSeek’s.
Anthropic กล่าวว่า Claude 3.7 Sonnet ได้รับการปรับเพื่อใช้ในการประยุกต์ใช้จริงเพื่อนว่ากว่าเป็นเครื่องมือทดสอบแบบกีฬา การทดสอบเบื้องต้นแสดงให้เห็นว่าโหมดการใช้เหตุผลขั้นสูงทำให้ประสิทธิภาพในการทำงานที่มีความซับซ้อนที่เกี่ยวข้องกับฐานข้อมูลโค้ด, การใช้เครื่องมือขั้นสูง, และการพัฒนาซอฟต์แวร์เต็มรูปแบบมีความสำเร็จมากขึ้น.
โมเดลได้รับการประเมินผลบน SWE-bench Verified และ TAU-bench ซึ่งมีรายงานว่าสามารถทำได้ดีกว่าเวอร์ชั่นก่อนหน้านี้ ตามที่ Anthropic รายงาน
CNN ระบุว่า Anthropic ได้รักษาราคาของ Claude 3.7 ให้เท่ากับโมเดลก่อนหน้านี้ ซึ่งทำให้มันอยู่ในราคาที่ต่ำกว่าผลิตภัณฑ์ล่าสุดของ OpenAI ราคาคือ $3 ต่อล้าน input tokens และ $15 ต่อล้าน output tokens เมื่อเทียบกับ $15 และ $60 ของ OpenAI สำหรับชั้นที่คล้ายกัน
แสดงความคิดเห็น
ยกเลิก