AI ของ DeepSeek เรียนรู้วิธีคิดด้วยตัวเอง

Image by Matheus Bertelli, from Pexels

AI ของ DeepSeek เรียนรู้วิธีคิดด้วยตัวเอง

ระยะเวลาในการอ่าน: 1 นาที

  • Kiara Fabbri

    ถูกเขียนขึ้นโดย Kiara Fabbri นักข่าวมัลติมีเดีย

  • ทีมแปลภาษา

    แปลโดย ทีมแปลภาษา ทีมแปลภาษาและบริการแปลภาษา

สตาร์ทอัพจีน DeepSeek ร่วมกับมหาวิทยาลัย Tsinghua กล่าวว่า พวกเขาได้พัฒนาวิธีที่ฉลาดขึ้นในการช่วยให้โมเดลปัญญาประดิษฐ์คิดได้ดียิ่งขึ้นและเร็วขึ้น โดยไม่จำเป็นต้องใช้คอมพิวเตอร์ขนาดใหญ่หรือทรัพยากรที่มีราคาแพง

รีบหรือเปล่า? นี่คือข้อมูลสำคัญๆที่คุณควรทราบ:

  • DeepSeek สร้าง AI ที่สามารถปรับปรุงตัวเองด้วยวิธี Self-Principled Critique Tuning (SPCT).
  • SPCT สอนให้ AI พิจารณาผลงานของตัวเองโดยใช้กฎที่สร้างขึ้นด้วยตัวเอง.
  • วิธีนี้ส่งเสริมการทำงานที่มีประสิทธิภาพโดยไม่ต้องใช้พลังการคำนวณที่มากมาย.

การทะลุผ่านมาจากเทคนิคใหม่ที่เรียกว่า Self-Principled Critique Tuning (SPCT) หรือการปรับแต่งตามหลักการตัวเอง SPCT ต่างจากการทำให้โมเดล AI ใหญ่ขึ้นเพื่อปรับปรุงประสิทธิภาพ – โดย SPCT ไม่ต้องการพลังงานและความสามารถในการคำนวณมากนักในการสอน AI ให้ตัดสินใจเรื่องงานของตัวเองด้วยกฎที่สร้างขึ้นด้วยตนเอง.

วิธีการทำงานของมันคือผ่าน “ผู้ตัดสิน” ที่ภายในซึ่งสามารถตรวจสอบว่าการตอบสนองของ AI ทั้งสอดคล้องกับกฎการตัดสินใจภายใน และเหมาะสมสำหรับการส่งออกผลลัพธ์ในรูปแบบที่มนุษย์สามารถเข้าใจได้ เมื่อ AI ให้การตอบสนองที่แข็งแกร่ง มันจะได้รับคำติชมที่เชิงบวก ซึ่งช่วยให้มันสามารถปรับปรุงความสามารถในการตอบคำถามที่คล้ายคลึงกันในครั้งถัดไปได้

DeepSeek นำวิธีนี้มาใช้เป็นส่วนหนึ่งของระบบ DeepSeek-GRM ซึ่งย่อมาจาก Generative Reward Modeling ด้วยวิธีการที่ไม่เหมือนกับวิธีการดั้งเดิม GRM ทำการตรวจสอบแบบขนานเพื่อเพิ่มความถูกต้องและความสอดคล้อง

“เราขอเสนอวิธีการปรับปรุงการวิจารณ์ตามหลักธรรมนูญส่วนบุคคล (SPCT) เพื่อส่งเสริมพฤติกรรมการสร้างรางวัลที่มีขนาดใหญ่” นักวิจัยเขียนในเอกสารวิชาการของพวกเขา “SPCT ทำให้[the model]สามารถปรับตัวให้เหมาะสมกับหลักธรรมนูญและการวิจารณ์ที่ขึ้นกับคำสั่งและการตอบสนอง ซึ่งนำไปสู่รางวัลผลที่ดีขึ้น”

ด้วยระบบนี้ DeepSeek อ้างว่า AI ของบริษัทสามารถทำงานได้ดีกว่าคู่แข่ง เช่น Gemini ของ Google, Llama ของ Meta, และ GPT-4o ของ OpenAI, โดยเฉพาะในงานที่ซับซ้อนเช่นการใช้เหตุผลหรือการตัดสินใจ ดังที่ Euronews ได้ระบุไว้

ที่สำคัญ, DeepSeek กล่าวว่ามีแผนที่จะปล่อยเครื่องมือใหม่เหล่านี้ในรูปแบบของซอฟต์แวร์ที่เปิดเผยต้นฉบับ แต่ยังไม่ได้แจ้งวันที่จะเปิดตัวเครื่องมือเหล่านั้น

คุณชอบบทความนี้ไหม?
โหวตให้คะแนนเลยสิ!
ฉันเกลียดมัน ฉันไม่ค่อยชอบเท่าไหร่ พอใช้ได้ ค่อนข้างดี รักเลย!

เราดีใจที่คุณชื่นชอบผลงานของเรา!

ในฐานะผู้อ่านผู้ทรงคุณค่า คุณช่วยให้คะแนนเราบน Trustpilot หน่อยได้ไหม? การให้คะแนนนั้นรวดเร็วและสำคัญกับเรามาก ขอบคุณสำหรับความร่วมมือ!

ให้คะแนนเราบน Trustpilot
0 ได้รับการโหวตให้คะแนนโดย 0 ผู้ใช้
ชื่อเรื่อง
ความคิดเห็น
ขอบคุณสำหรับคำแนะนำของคุณ
Loader
Please wait 5 minutes before posting another comment.
Comment sent for approval.

แสดงความคิดเห็น

Loader
Loader แสดงเพิ่มเติม...