
Image by Matheus Bertelli, from Pexels
AI ของ DeepSeek เรียนรู้วิธีคิดด้วยตัวเอง
สตาร์ทอัพจีน DeepSeek ร่วมกับมหาวิทยาลัย Tsinghua กล่าวว่า พวกเขาได้พัฒนาวิธีที่ฉลาดขึ้นในการช่วยให้โมเดลปัญญาประดิษฐ์คิดได้ดียิ่งขึ้นและเร็วขึ้น โดยไม่จำเป็นต้องใช้คอมพิวเตอร์ขนาดใหญ่หรือทรัพยากรที่มีราคาแพง
รีบหรือเปล่า? นี่คือข้อมูลสำคัญๆที่คุณควรทราบ:
- DeepSeek สร้าง AI ที่สามารถปรับปรุงตัวเองด้วยวิธี Self-Principled Critique Tuning (SPCT).
- SPCT สอนให้ AI พิจารณาผลงานของตัวเองโดยใช้กฎที่สร้างขึ้นด้วยตัวเอง.
- วิธีนี้ส่งเสริมการทำงานที่มีประสิทธิภาพโดยไม่ต้องใช้พลังการคำนวณที่มากมาย.
การทะลุผ่านมาจากเทคนิคใหม่ที่เรียกว่า Self-Principled Critique Tuning (SPCT) หรือการปรับแต่งตามหลักการตัวเอง SPCT ต่างจากการทำให้โมเดล AI ใหญ่ขึ้นเพื่อปรับปรุงประสิทธิภาพ – โดย SPCT ไม่ต้องการพลังงานและความสามารถในการคำนวณมากนักในการสอน AI ให้ตัดสินใจเรื่องงานของตัวเองด้วยกฎที่สร้างขึ้นด้วยตนเอง.
วิธีการทำงานของมันคือผ่าน “ผู้ตัดสิน” ที่ภายในซึ่งสามารถตรวจสอบว่าการตอบสนองของ AI ทั้งสอดคล้องกับกฎการตัดสินใจภายใน และเหมาะสมสำหรับการส่งออกผลลัพธ์ในรูปแบบที่มนุษย์สามารถเข้าใจได้ เมื่อ AI ให้การตอบสนองที่แข็งแกร่ง มันจะได้รับคำติชมที่เชิงบวก ซึ่งช่วยให้มันสามารถปรับปรุงความสามารถในการตอบคำถามที่คล้ายคลึงกันในครั้งถัดไปได้
DeepSeek นำวิธีนี้มาใช้เป็นส่วนหนึ่งของระบบ DeepSeek-GRM ซึ่งย่อมาจาก Generative Reward Modeling ด้วยวิธีการที่ไม่เหมือนกับวิธีการดั้งเดิม GRM ทำการตรวจสอบแบบขนานเพื่อเพิ่มความถูกต้องและความสอดคล้อง
“เราขอเสนอวิธีการปรับปรุงการวิจารณ์ตามหลักธรรมนูญส่วนบุคคล (SPCT) เพื่อส่งเสริมพฤติกรรมการสร้างรางวัลที่มีขนาดใหญ่” นักวิจัยเขียนในเอกสารวิชาการของพวกเขา “SPCT ทำให้[the model]สามารถปรับตัวให้เหมาะสมกับหลักธรรมนูญและการวิจารณ์ที่ขึ้นกับคำสั่งและการตอบสนอง ซึ่งนำไปสู่รางวัลผลที่ดีขึ้น”
ด้วยระบบนี้ DeepSeek อ้างว่า AI ของบริษัทสามารถทำงานได้ดีกว่าคู่แข่ง เช่น Gemini ของ Google, Llama ของ Meta, และ GPT-4o ของ OpenAI, โดยเฉพาะในงานที่ซับซ้อนเช่นการใช้เหตุผลหรือการตัดสินใจ ดังที่ Euronews ได้ระบุไว้
ที่สำคัญ, DeepSeek กล่าวว่ามีแผนที่จะปล่อยเครื่องมือใหม่เหล่านี้ในรูปแบบของซอฟต์แวร์ที่เปิดเผยต้นฉบับ แต่ยังไม่ได้แจ้งวันที่จะเปิดตัวเครื่องมือเหล่านั้น
แสดงความคิดเห็น
ยกเลิก