🎯 สรุปสั้นๆ
- Claude Fable 5 และ Mythos 5 ใช้โมเดลพื้นฐานเดียวกัน แต่แตกต่างกันที่ระดับ Safeguards และกลุ่มเป้าหมาย โดย Mythos 5 เปิดให้เฉพาะ Cyberdefenders และ Infrastructure Providers ที่ผ่านการคัดกรองผ่าน Project Glasswing และ Broader Trusted Access Program
- จุดแข็งที่แท้จริงของ Fable 5 ไม่ใช่แค่ความเร็ว แต่คือความสามารถทำงาน Autonomous ได้นานและแม่นยำกว่าโมเดลใดๆ ที่ผ่านมา ยิ่งงานซับซ้อนและใช้เวลานาน ช่องว่างระหว่าง Fable 5 กับคู่แข่งยิ่งกว้างขึ้น
- Safeguard ของ Fable 5 trigger เฉลี่ยไม่เกิน 5% ของ sessions โดยระบบจะ fallback ไปยัง Claude Opus 4.8 โดยอัตโนมัติ และ Anthropic มีแผนลด false positives ในอนาคตอันใกล้
วันนี้เราเปิดตัว Claude Fable 5 ซึ่งเป็นโมเดลระดับ Mythos 1 ที่เราได้ทำให้ปลอดภัยสำหรับการใช้งานทั่วไปแล้ว
ความสามารถของ Fable 5 เหนือกว่าโมเดลใดๆ ที่เราเคยเปิดให้ใช้งานทั่วไปมาก่อน โมเดลนี้อยู่ในระดับแนวหน้าของเกือบทุกเกณฑ์การทดสอบความสามารถของ AI โดยแสดงผลลัพธ์ที่โดดเด่นในด้านวิศวกรรมซอฟต์แวร์ งานด้านความรู้ การมองเห็น การวิจัยทางวิทยาศาสตร์ และอีกหลายด้าน ยิ่งงานมีความยาวและซับซ้อนมากเท่าใด Fable 5 ก็ยิ่งมีความได้เปรียบเหนือโมเดลอื่นๆ ของเรามากขึ้นเท่านั้น
การเปิดตัวโมเดลที่มีความสามารถสูงขนาดนี้มาพร้อมกับความเสี่ยง หากปราศจากมาตรการป้องกัน ความสามารถของ Fable 5 ในด้านต่างๆ เช่น ความปลอดภัยทางไซเบอร์ อาจถูกนำไปใช้ในทางที่ผิดจนก่อให้เกิดความเสียหายร้ายแรงได้ ด้วยเหตุนี้เราจึงเปิดตัวโมเดลนี้พร้อมมาตรการป้องกัน ซึ่งหมายความว่าคำถามในบางหัวข้อจะได้รับการตอบสนองจากโมเดลที่มีความสามารถรองลงมาของเรา คือ Claude Opus 4.8 แทน เพื่อให้สามารถเปิดตัวโมเดลได้ทั้งอย่างปลอดภัยและรวดเร็ว เราได้ปรับมาตรการป้องกันเหล่านี้ไว้อย่างระมัดระวัง ซึ่งอาจทำให้คำขอที่ไม่เป็นอันตรายบางส่วนถูกกรองออกไปด้วย แม้ว่าโดยเฉลี่ยแล้วจะเกิดขึ้นในไม่ถึง 5% ของการใช้งาน เมื่อโมเดลที่มีความสามารถสูงขึ้นจะมาถึงในอีกไม่กี่เดือนข้างหน้า เรากำลังทำงานเพื่อปรับปรุงมาตรการป้องกันและลดการกรองผิดพลาดให้เร็วที่สุดเท่าที่จะทำได้
สำหรับกลุ่มผู้เชี่ยวชาญด้านการป้องกันทางไซเบอร์และผู้ให้บริการโครงสร้างพื้นฐานกลุ่มเล็กๆ เรายังเปิดตัว Claude Mythos 5 ด้วย โมเดลนี้ใช้พื้นฐานเดียวกันกับ Fable 5 แต่มีการยกเว้นมาตรการป้องกันในบางด้าน 2 ในช่วงแรก Mythos 5 จะถูกนำไปใช้งานผ่าน Project Glasswing ร่วมกับรัฐบาลสหรัฐฯ ในฐานะการอัปเกรดจาก Claude Mythos Preview โดยมีความสามารถด้านความปลอดภัยทางไซเบอร์ที่แข็งแกร่งที่สุดในบรรดาโมเดลทั้งหมดในโลก และในเร็วๆ นี้ เราตั้งใจจะขยายการเข้าถึง Mythos 5 ผ่านโปรแกรมการเข้าถึงแบบเชื่อถือได้ในวงกว้างขึ้น
ความสามารถของโมเดลอย่าง Fable 5 และ Mythos 5 มีศักยภาพที่จะสร้างประโยชน์อย่างลึกซึ้งให้กับโลก เราได้เห็นจุดเริ่มต้นของสิ่งนี้แล้วใน Project Glasswing ซึ่งโมเดลเหล่านี้ได้ช่วยผู้เชี่ยวชาญด้านการป้องกันทางไซเบอร์รักษาความปลอดภัยให้กับซอฟต์แวร์ที่มีความสำคัญอย่างยิ่ง นอกจากนี้เรายังได้เห็นในการวิจัยด้านวิทยาศาสตร์ชีวภาพ ซึ่งโมเดลเหล่านี้กำลังเสนอสมมติฐานใหม่และเร่งการพัฒนายารักษาโรคชนิดใหม่
Fable 5 และ Mythos 5 มีราคาอยู่ที่ 10 ดอลลาร์ต่อล้าน input token และ 50 ดอลลาร์ต่อล้าน output token ซึ่งน้อยกว่าครึ่งหนึ่งของราคา Claude Mythos Preview การเปิดตัวร่วมกันในวันนี้เป็นอีกก้าวหนึ่งสู่เป้าหมายของเราในการนำความสามารถของ AI ขั้นสูงมาสู่ผู้ใช้ให้ได้มากที่สุด เร็วที่สุด และปลอดภัยที่สุดเท่าที่จะทำได้
การประเมิน Claude Fable 5 และ Claude Mythos 5
ตารางด้านล่างเปรียบเทียบความสามารถของ Fable 5 และ Mythos 5 กับโมเดลชั้นนำอื่นๆ
Fable 5 และ Mythos 5 สามารถทำงานโดยอัตโนมัติได้นานกว่าโมเดล Claude รุ่นก่อนๆ ทั้งหมด ในส่วนต่อไปเราจะพูดถึงว่าทักษะเหล่านี้นำไปใช้กับงานวิศวกรรมซอฟต์แวร์ได้อย่างไร และครอบคลุมถึงความสามารถที่ได้รับการปรับปรุงของโมเดลในด้านงานความรู้ การมองเห็น หน่วยความจำ และการวิจัยด้านวิทยาศาสตร์ชีวภาพ
วิศวกรรมซอฟต์แวร์ ในช่วงการทดสอบเบื้องต้น Stripe รายงานว่า Fable 5 สามารถบีบอัดงานวิศวกรรมที่ปกติต้องใช้เวลาหลายเดือนให้เสร็จภายในไม่กี่วัน ในโค้ดเบส Ruby ขนาด 50 ล้านบรรทัด โมเดลสามารถดำเนินการย้ายระบบทั่วทั้งโค้ดเบสได้ภายในหนึ่งวัน ซึ่งหากทำด้วยมือจะต้องใช้ทีมงานทั้งทีมนานกว่าสองเดือน นอกจากนี้ Fable 5 ยังใช้โทเคนอย่างมีประสิทธิภาพมากกว่าโมเดล Claude รุ่นก่อนหน้า โดยในการประเมิน FrontierCode ของ Cognition ซึ่งทดสอบว่าโมเดลสามารถผ่านงานเขียนโค้ดที่ยากได้หรือไม่ในขณะที่ยังคงมาตรฐานของโค้ดเบสระดับ production คุณภาพสูง Fable 5 ทำคะแนนได้สูงสุดในบรรดาโมเดลชั้นนำ แม้จะใช้ความพยายามในระดับปานกลางก็ตาม
งานด้านความรู้ Fable 5 แสดงประสิทธิภาพที่โดดเด่นในงานวิเคราะห์ที่ซับซ้อน ในการประเมิน Finance Benchmark ของ Hebbia สำหรับการใช้เหตุผลระดับอาวุโส Fable 5 ทำคะแนนได้สูงสุดในบรรดาโมเดลทั้งหมด โดยมีพัฒนาการอย่างมีนัยสำคัญในด้านการใช้เหตุผลจากเอกสาร การตีความแผนภูมิและตาราง รวมถึงการแก้ปัญหา IMC ระบุว่า Fable 5 ทำได้อย่างยอดเยี่ยมในการประเมินด้านการวิเคราะห์การซื้อขายแทบทุกด้าน ทั้งการค้นหาข้อเท็จจริง การใช้เหตุผลเชิงแนวคิด การวิเคราะห์หาสาเหตุที่แท้จริง และการวิเคราะห์มูลค่าที่คาดหวัง
การมองเห็น Fable 5 เป็นโมเดลที่มีความสามารถสูงสุดในปัจจุบันสำหรับงานที่เกี่ยวข้องกับการมองเห็น สามารถดึงตัวเลขที่แม่นยำจากภาพทางวิทยาศาสตร์ที่มีรายละเอียดซับซ้อน และสามารถทำงานด้านการมองเห็นที่ซับซ้อน เช่น การสร้างซอร์สโค้ดของเว็บแอปขึ้นมาใหม่จากภาพหน้าจอเพียงอย่างเดียว นอกจากนี้ยังต้องการโครงสร้างช่วยเหลือน้อยลง ตัวอย่างเช่น โมเดล Claude รุ่นก่อนหน้าประสบปัญหาในการเล่นเกม Pokémon FireRed แม้จะมีเครื่องมือช่วยเหลือเพิ่มเติม แต่ Fable 5 สามารถเอาชนะ FireRed ได้โดยใช้เพียงระบบช่วยเหลือขั้นต่ำที่อาศัยการมองเห็นเท่านั้น
หน่วยความจำและบริบทยาว Fable 5 สามารถรักษาสมาธิได้ตลอดการประมวลผลโทเคนหลายล้านตัวในงานที่ใช้เวลานาน และปรับปรุงผลลัพธ์ของตัวเองโดยใช้บันทึกที่จดไว้ เมื่อเราให้โมเดลเล่นเกมสร้างสำรับไพ่ Slay the Spire โดยให้เข้าถึงหน่วยความจำแบบไฟล์ถาวรได้ พบว่าประสิทธิภาพของ Fable ดีขึ้นมากกว่าของ Opus 4.8 ถึงสามเท่า และ Fable ยังสามารถไปถึงฉากสุดท้ายของเกมได้บ่อยกว่าถึงสามเท่าเช่นกัน
การออกแบบยา โดยใช้ Mythos 5 ผู้เชี่ยวชาญด้านการออกแบบโปรตีนภายในองค์กรของเราสามารถเร่งกระบวนการออกแบบยาในบางส่วนได้เร็วขึ้นประมาณสิบเท่า ในตัวอย่างหนึ่ง พบว่า Mythos 5 ที่มีเครื่องมือด้านการออกแบบโปรตีนและชีวสารสนเทศศาสตร์แต่ไม่มีความช่วยเหลือจากมนุษย์ สามารถทำได้เทียบเท่าหรือดีกว่าผู้ปฏิบัติงานที่มีทักษะ ในการดำเนินการดังกล่าว โมเดลจะทำงานทุกอย่างที่นักวิทยาศาสตร์ปกติต้องทำ ได้แก่ การเลือกตำแหน่งการจับ การเลือกและใช้งานเครื่องมือออกแบบโปรตีน และการแก้ไขปัญหาที่เกิดขึ้นระหว่างทาง จากเป้าหมายโปรตีน 14 รายการในการศึกษานี้ มีถึง 9 รายการที่ให้ผู้สมัครที่มีศักยภาพสูงสำหรับการออกแบบยา ซึ่งเราอยู่ระหว่างการตรวจสอบอยู่ในขณะนี้
สมมติฐานใหม่ในสาขาชีววิทยาระดับโมเลกุล Mythos 5 เป็นโมเดลแรกของเราที่สามารถสร้างสมมติฐานทางวิทยาศาสตร์ที่แปลกใหม่และน่าสนใจได้อย่างสม่ำเสมอ ในการเปรียบเทียบแบบปกปิดข้อมูลระหว่าง Mythos กับโมเดลระดับ Opus นักวิทยาศาสตร์ของเราชื่นชอบสมมติฐานด้านชีววิทยาระดับโมเลกุลของ Mythos ประมาณ 80% ของเวลา และได้นำสมมติฐานหลายข้อไปสู่การประเมินเชิงทดลองแล้ว ในระหว่างนี้ สมมติฐานหนึ่งของ Mythos ซึ่งเป็นกลไกใหม่สำหรับโปรตีนในแบคทีเรีย E. coli ได้รับการยืนยันจากการศึกษาของห้องปฏิบัติการอื่นที่ทำงานบนปัญหาเดียวกันโดยอิสระ
งานวิจัยใหม่ในสาขาจีโนมิกส์ Mythos 5 ดำเนินงานวิจัยจีโนมิกส์แบบใหม่ในช่วงเวลากว่าหนึ่งสัปดาห์ด้วยการทำงานอิสระเป็นส่วนใหญ่ โดยรวบรวมข้อมูลเซลล์เดี่ยวจากเซลล์หลายล้านเซลล์ที่ครอบคลุมสัตว์ 138 สายพันธุ์ และออกแบบรวมถึงฝึกโมเดลแมชชีนเลิร์นนิงแบบกำหนดเองเพื่อระบุเซลล์ที่ทำหน้าที่เดียวกันแม้ในสิ่งมีชีวิตที่มีความสัมพันธ์ห่างไกลกัน ด้วยการป้อนข้อมูลจากมนุษย์เพียงในระดับภาพรวม โมเดลที่ Mythos 5 ฝึกขึ้นมามีประสิทธิภาพเหนือกว่าโมเดลล่าสุดที่ตีพิมพ์ในวารสาร Science แม้จะมีขนาดเล็กกว่าถึง 100 เท่า เราตั้งใจจะเผยแพร่ผลลัพธ์เหล่านี้ในอีกไม่กี่เดือนข้างหน้า
การจัดแนว ในการประเมินการจัดแนวอัตโนมัติของเรา พบว่าระดับพฤติกรรมที่ไม่สอดคล้องของ Mythos 5 ซึ่งรวมถึงการกระทำที่ไม่สอดคล้อง เช่น การหลอกลวง และการร่วมมือกับการใช้งานโมเดลในทางที่ผิดโดยผู้ใช้ อยู่ในระดับต่ำ และใกล้เคียงกับ Opus 4.8 เนื่องจากเป็นโมเดลพื้นฐานเดียวกัน ระดับการจัดแนวของ Fable 5 จึงจะใกล้เคียงกัน การประเมินดังกล่าวได้รับการอธิบายอย่างครบถ้วน พร้อมกับชุดการทดสอบด้านความปลอดภัยและความสามารถอื่นๆ อย่างละเอียด ในการ์ดระบบของโมเดล
ข้อเสนอแนะเบื้องต้นสำหรับ Claude Fable 5
ลูกค้าที่ได้รับสิทธิ์เข้าถึงล่วงหน้าได้ทำการทดสอบ Fable 5 ด้วยตนเอง ด้านล่างนี้คือการคัดเลือกสิ่งที่พวกเขาพบเห็น ในคำพูดของพวกเขาเอง
“Claude Fable 5 เป็นโมเดลที่ดีที่สุดใน CursorBench มันเปิดประตูสู่ปัญหาระยะยาวที่ซับซ้อนซึ่งเคยอยู่นอกเหนือความสามารถของโมเดลรุ่นก่อนหน้า”
“Claude Fable 5 เป็นก้าวสำคัญสำหรับนักพัฒนาที่ GitHub ให้บริการ ในการทดสอบเบื้องต้นของเรา มันรับมืองานเขียนโค้ดที่ซับซ้อนและมีระยะยาวด้วยระดับความเป็นอิสระและความน่าเชื่อถือที่เกินกว่ามาตรฐานก่อนหน้า แต่สิ่งที่ทำให้เราตื่นเต้นที่สุดคือทิศทางที่มันชี้ให้เห็น นั่นคืออนาคตที่นักพัฒนาสามารถมอบงานที่ทะเยอทะยานมากขึ้นเรื่อยๆ ให้กับเอเจนต์และไว้วางใจในผลลัพธ์ตลอดวงจรชีวิตของซอฟต์แวร์”
“นี่คือผลลัพธ์ที่แข็งแกร่งที่สุดของโมเดล Claude ใดๆ ที่เราเคยมีโอกาสทดสอบ Claude Fable 5 เป็นก้าวที่ชัดเจนในการก้าวหน้าด้านการเขียนโค้ดแบบเอเจนต์และการสร้างต้นแบบ”
“การใช้เหตุผลของ Claude Fable 5 ก้าวข้าม Opus 4.8 อย่างชัดเจน มันทำงานในระดับนักวิทยาศาสตร์วิจัยอาวุโส ทั้งการเลือกทิศทาง การจัดสรรทรัพยากร การละทิ้งความเชื่อที่ผิดพลาด และการสร้างผลลัพธ์ใหม่จากหลักการพื้นฐาน”
“Claude Fable 5 เข้าใจสิ่งที่ผู้สร้างต้องการจะสื่อ ไม่ใช่แค่สิ่งที่พวกเขาพิมพ์ แอปที่เคยต้องใช้การพรอมต์นับร้อยครั้งเมื่อปีที่แล้ว ตอนนี้มันทำสำเร็จในครั้งเดียว เมื่อลูกค้าติดขัดจริงๆ มันคือโมเดลที่เราหยิบมาใช้เพื่อช่วยให้พวกเขาผ่านพ้นอุปสรรคได้อย่างรวดเร็ว เพื่อให้พวกเขาสามารถทำสิ่งที่ตั้งใจไว้ให้สำเร็จ”
“Claude Fable 5 รู้สึกแตกต่างออกไปอย่างเห็นได้ชัด ในการตรวจสอบแบบปิดบังชื่อ ทนายความของเราพบว่าการทำเครื่องหมายแก้ไขของมันเทียบเท่าหรือดีกว่าโมเดลปัจจุบันของเราทุกครั้ง”
“ที่ระดับความพยายามสูงสุด Claude Fable 5 จะสะท้อนและตรวจสอบผลงานของตัวเองซ้ำ สำหรับเรา นั่นคือสิ่งที่ทำให้การทำงานแบบอัตโนมัติสูงเป็นไปได้ การคิดเพิ่มเติมนั้นคุ้มค่ากับสิ่งที่ได้รับ”
“Claude Fable 5 มอบความสามารถด้านวิศวกรรมที่สูงขึ้นในจำนวนรอบที่น้อยกว่าโมเดลรุ่นก่อน โดยรองรับเวิร์กโฟลว์แบบหลายตัวแทนที่ซับซ้อนซึ่งพนักงานของเราใช้งานทุกวันใน Claude Code”
“Claude Fable 5 เป็นโมเดลที่ได้คะแนนสูงสุดใน FrontierBench ซึ่งเป็นการประเมินการเขียนโค้ดระดับแนวหน้าของ Cognition มันโดดเด่นในด้านการใช้เหตุผลระยะยาว และสามารถปรับตัวเข้ากับเครื่องมือที่ไม่คุ้นเคยได้ทันที”
“Claude Fable 5 เป็นโมเดลที่เน้นด้านการเงินที่แข็งแกร่งที่สุดที่เราเคยทดสอบ ทั้งในด้านการเงินทั่วไปและการใช้เหตุผล ถือเป็นก้าวที่โดดเด่นขึ้นมาอย่างชัดเจน”
“Claude Fable 5 เป็นรายแรกที่ทำคะแนนเกิน 90% ในเกณฑ์มาตรฐานการวิเคราะห์หลักของเราสำหรับงานวิเคราะห์ที่ซับซ้อนและใช้เวลานาน ซึ่งเพิ่มขึ้น 10 คะแนนจาก Opus ในคำถามที่ยากที่สุด มันแสดงให้เห็นถึงวิจารณญาณที่ดีและความใส่ใจในความละเอียดอ่อน”
“Claude Fable 5 เป็นโมเดลที่แข็งแกร่งที่สุดที่เราเคยทดสอบสำหรับการวิจัยฟิสิกส์ระดับแนวหน้า ในขณะที่ใช้โทเค็นสำหรับการใช้เหตุผลเพียงหนึ่งในสาม ภายใน 36 ชั่วโมง มันทำได้ใกล้เคียงกับจุดที่ GPT-5.5 ไปถึงหลังจากสี่วัน”
“ใน ViBench ซึ่งเป็นเกณฑ์มาตรฐานการเขียนโค้ดแบบ vibe-coding แบบครบวงจรของเรา Claude Fable 5 เป็นโมเดลที่มีประสิทธิภาพสูงสุดที่เราเคยทดสอบ โดยเกือบจะครอบคลุมกรณีการใช้งานพื้นฐานของเราได้ทั้งหมด และสร้างแอปได้ในเวลาที่น้อยลงด้วยโทเค็นที่น้อยลง”
“Claude Fable 5 เอาชนะ Opus 4.8 ในชุดสเปรดชีตสำหรับการใช้งานประจำวันของเราในทุกระดับความพยายาม และทำได้ด้วยจำนวนรอบที่น้อยกว่า โดยเสร็จสิ้นการทำงานเร็วกว่า 25 ถึง 30 เปอร์เซ็นต์”
มาตรการป้องกันใหม่ของ Claude Fable 5
โมเดลระดับ Mythos ได้ถึงจุดที่ก่อให้เกิดความเสี่ยงอย่างมีนัยสำคัญ ในเดือนเมษายน เราได้เริ่มโครงการ Glasswing โดยเปิดตัวโมเดลระดับ Mythos รุ่นแรก ซึ่งก็คือ Claude Mythos Preview ให้กับกลุ่มผู้เชี่ยวชาญด้านการป้องกันไซเบอร์และผู้ให้บริการโครงสร้างพื้นฐานซอฟต์แวร์ที่สำคัญเพียงกลุ่มเล็กๆ เท่านั้น เมื่อดำเนินการดังกล่าว เราได้ระบุว่าเราหวังจะเปิดตัวความสามารถระดับ Mythos ให้กับผู้ใช้ทุกคนในที่สุด ตราบใดที่เราได้พัฒนามาตรการป้องกันใหม่ที่แข็งแกร่งพอที่จะป้องกันการใช้งานในทางที่ผิดได้อย่างน่าเชื่อถือ
ในช่วงไม่กี่เดือนที่ผ่านมา เราได้ปรับปรุงมาตรการป้องกันเหล่านี้อย่างต่อเนื่อง และขณะนี้มีความแข็งแกร่งเพียงพอสำหรับการเปิดตัวสู่สาธารณะทั่วไป เนื่องจากเราให้ความสำคัญกับความปลอดภัยเป็นอันดับแรก เราจึงได้ปรับแต่งมาตรการป้องกันให้มีความระมัดระวังโดยเจตนา และยังคงเข้มงวดกว่าที่ควรจะเป็นในอุดมคติ ตัวอย่างเช่น บางครั้งคำขอที่ไม่เป็นอันตรายอาจทำให้ตัวจำแนกประเภทของเราทำงาน เราตระหนักดีว่าสิ่งนี้อาจสร้างความหงุดหงิดให้กับผู้ใช้บางส่วน และเป้าหมายของเราคือการลดผลบวกลวงเมื่อเราอัปเดตและปรับปรุงมาตรการป้องกันหลังการเปิดตัว
ด้านล่างนี้เราจะกล่าวถึงมาตรการป้องกันใหม่แต่ละอย่างของ Fable 5 ตามลำดับ ชุดมาตรการป้องกันที่กว้างขึ้นของเราได้รับการอภิปรายและประเมินในการ์ดระบบของโมเดลและรายงานความเสี่ยงล่าสุดของเรา
ตัวจำแนกประเภทด้านความปลอดภัย
ความสามารถด้านความปลอดภัยทางไซเบอร์และการวิจัยชีววิทยาขั้นสูงของโมเดลระดับ Mythos หมายความว่าโมเดลเหล่านี้มีความเสี่ยงสูงที่จะเป็นประโยชน์แก่ผู้ไม่ประสงค์ดี กล่าวคือ โมเดลเหล่านี้อาจให้ข้อมูลหรือคำแนะนำที่ช่วยให้ผู้ไม่ประสงค์ดีก่อความเสียหายร้ายแรงในแบบที่พวกเขาไม่สามารถหาได้จากแหล่งอื่น เช่น จากเครื่องมือค้นหาบนอินเทอร์เน็ต นอกจากนี้ การใช้งานโมเดล AI ขั้นสูงจำนวนมากยังมีลักษณะที่ใช้ได้สองทาง กล่าวคือ คำถามชุดเดียวกันที่เป็นประโยชน์ในมือของผู้เชี่ยวชาญด้านความปลอดภัยทางไซเบอร์และนักวิจัยชีววิทยา อาจกลายเป็นอันตรายได้หากตกอยู่ในมือของผู้ไม่ประสงค์ดี
ด้วยเหตุนี้ เราจึงจำเป็นต้องมีมาตรการป้องกันที่เข้มแข็งเพื่อป้องกันการนำไปใช้ในทางที่ผิด และมาตรการเหล่านั้นต้องครอบคลุมในวงกว้าง ตัวมาตรการเองต้องสามารถรับมือกับความพยายามอย่างต่อเนื่องและซับซ้อนในการหลีกเลี่ยง หรือที่เรียกว่าการ “เจลเบรก” ระบบ ประโยชน์ที่ได้จากความสามารถระดับ Mythos มีคุณค่าสำหรับฝ่ายตรงข้ามจำนวนมาก เช่น ผู้ที่อาจได้รับผลประโยชน์ทางการเงินจากการโจมตีทางไซเบอร์ ดังนั้นเราจึงคาดว่าพวกเขาจะมีแรงจูงใจในการพยายามหลีกเลี่ยงมาตรการความปลอดภัยของเรา
Fable 5 มาพร้อมกับชุดตัวจำแนกประเภทใหม่ ซึ่งเป็นระบบ AI แยกต่างหากที่ทำหน้าที่ตรวจจับการใช้งานในทางที่ผิดที่อาจเกิดขึ้น รวมถึงความพยายามในการเจลเบรก และป้องกันไม่ให้โมเดลหลัก ซึ่งในกรณีนี้คือ Fable 5 ตอบสนองต่อคำขอเหล่านั้น เราได้ใช้งานตัวจำแนกประเภทบนโมเดลของเรามาระยะหนึ่งแล้ว และตัวจำแนกประเภทของ Fable 5 เป็นการต่อยอดจากงานก่อนหน้านี้โดยมีการครอบคลุมเพิ่มเติม
เมื่อตัวจำแนกประเภทของ Fable ตรวจพบคำขอที่เกี่ยวข้องกับความปลอดภัยทางไซเบอร์ ชีววิทยาและเคมี หรือการกลั่น การตอบสนองจะถูกจัดการโดย Claude Opus 4.8 โดยอัตโนมัติแทน ผู้ใช้จะได้รับแจ้งทุกครั้งที่เกิดเหตุการณ์นี้ขึ้น Opus 4.8 เป็นโมเดลที่มีความสามารถสูงในตัวเอง การตอบสนองที่ถูกส่งต่อไปยัง Opus ถือเป็นประสบการณ์ที่ดีกว่าการปฏิเสธโดยตรงจาก Fable มาก ข้อมูลเบื้องต้นของเราแสดงให้เห็นว่ามากกว่า 95% ของเซสชันการใช้งาน Fable ไม่มีการส่งต่อเลย สำหรับเซสชันเหล่านั้น ประสิทธิภาพของ Fable 5 แทบไม่ต่างจาก Mythos 5
ต่อไปนี้คือพื้นที่ที่ครอบคลุมโดยตัวจำแนกประเภท
- ความปลอดภัยทางไซเบอร์ โมเดลระดับ Mythos มีความเชี่ยวชาญในการค้นหาและใช้ประโยชน์จากช่องโหว่ของซอฟต์แวร์ จึงสามารถทำให้การโจมตีทางไซเบอร์ง่ายขึ้นและมีต้นทุนต่ำลงอย่างมาก โมเดลระดับ Mythos ยังแสดงทักษะที่แข็งแกร่งในการแฮกแบบอัตโนมัติ ซึ่งเกี่ยวข้องกับการดำเนินการในหลายส่วนของการโจมตีทางไซเบอร์นอกเหนือจากการค้นหาช่องโหว่ ไม่ว่าจะเป็นการสอดแนม การค้นพบ การเคลื่อนที่ในระบบ และอื่น ๆ เพื่อป้องกันไม่ให้ทักษะการแฮกแบบอัตโนมัติเหล่านี้เป็นประโยชน์แก่การโจมตีทางไซเบอร์ เราจึงออกแบบตัวจำแนกประเภทด้านความปลอดภัยทางไซเบอร์ให้ครอบคลุมทั้งการใช้ประโยชน์จากช่องโหว่และงานไซเบอร์เชิงรุกในความหมายที่กว้างขึ้น ดังที่แสดงในกราฟด้านล่าง ตัวจำแนกประเภทของเราป้องกันไม่ให้ Fable สามารถดำเนินการใด ๆ ในงานเหล่านี้ได้
เราได้ทำการทดสอบเจาะระบบ (red-team) อย่างเข้มข้นกับตัวจำแนกประเภท (classifiers) ของเรา เพื่อทดสอบความแข็งแกร่งในการรับมือกับการหลบเลี่ยงข้อจำกัด (jailbreaks) นอกจากการทดสอบภายในแล้ว เรายังจัดโครงการ bug bounty ภายนอก ซึ่งไม่พบการหลบเลี่ยงข้อจำกัดแบบครอบคลุมทุกกรณี (universal jailbreaks) เลยในการทดสอบกว่า 1,000 ชั่วโมง องค์กรทดสอบเจาะระบบภายนอกที่เราว่าจ้างก็ยังไม่พบการหลบเลี่ยงข้อจำกัดแบบครอบคลุมทุกกรณีในงานที่ต้องดำเนินการต่อเนื่องระยะยาว (long-form agentic tasks) เช่นกัน แม้ว่า UK AISI จะมีความคืบหน้าในการค้นหาในช่วงการทดสอบเบื้องต้นระยะสั้น อาจเป็นไปไม่ได้เลยที่จะป้องกันการหลบเลี่ยงข้อจำกัดแบบครอบคลุมทุกกรณีได้อย่างสมบูรณ์ แต่เป้าหมายของเราคือทำให้การหลบเลี่ยงที่ยังคงมีอยู่นั้นใช้เวลานานและมีต้นทุนสูงพอที่เราจะสามารถตรวจจับและป้องกันได้ก่อนที่จะถูกนำไปใช้ในวงกว้าง
กราฟด้านล่างนี้มาจากการประเมินภายในของเรา แสดงให้เห็นว่ามาตรการป้องกันของ Fable 5 ทำให้มันมีความต้านทานต่อการหลบเลี่ยงข้อจำกัดได้ดีกว่าโมเดลที่เปิดให้ใช้งานทั่วไปรุ่นก่อนหน้าของเรา
พันธมิตรภายนอกรายหนึ่งของเราพบว่ามาตรการป้องกันของ Fable 5 ต่อคำถามที่เกี่ยวข้องกับการโจมตีทางไซเบอร์ที่เป็นอันตรายนั้นแข็งแกร่งที่สุดในบรรดาโมเดลทั้งหมดที่ทดสอบ (รวมถึง Opus 4.8 และ Opus 4.7) Fable 5 ไม่ยินยอมตอบสนองต่อคำขอที่เป็นอันตรายแบบรอบเดียว (single-turn) ที่เกี่ยวข้องกับการวางแผนโจมตีทางไซเบอร์ การพัฒนาช่องโหว่ หรือการหลบเลี่ยงการตรวจจับแม้แต่ครั้งเดียว ซึ่งเป็นเช่นนี้ไม่ว่าคำขอนั้นจะใช้เทคนิคการหลบเลี่ยงข้อจำกัดที่เผยแพร่สู่สาธารณะ 30 รูปแบบใดก็ตาม
- ชีววิทยาและเคมี เราใช้ตัวจำแนกประเภทของเรามาอย่างยาวนานเพื่อป้องกันไม่ให้โมเดลของเราตอบสนองต่อคำถามที่เกี่ยวข้องกับอาวุธชีวภาพในกลุ่มที่คัดเลือกมาอย่างจำกัด แต่เราไม่แน่ใจอีกต่อไปว่าการปิดกั้นเฉพาะกลุ่มที่จำกัดนั้นเพียงพอหรือไม่ ด้วยเหตุผลสองประการ ประการแรก เรามีเหตุผลที่น่ากังวลเกี่ยวกับผู้ไม่ประสงค์ดีที่มีทรัพยากรมากพยายามใช้โมเดลของเราเพื่อยกระดับความสามารถในการวิจัยทางชีววิทยาที่มีความเสี่ยงสูง ประการที่สอง โมเดลต่าง ๆ ในปัจจุบันมีความสามารถในการทำงานทางวิทยาศาสตร์ในโลกจริงได้มากขึ้น
ตัวอย่างเช่น เราทดสอบความสามารถของ Mythos 5 ในการทำขั้นตอนที่ท้าทายในการออกแบบอะดีโน-แอสโซซิเอเต็ดไวรัส (adeno-associated viruses หรือ AAVs) AAVs เป็นส่วนประกอบสำหรับส่งยีนบำบัด แต่ความสามารถเดียวกันนี้หากตกอยู่ในมือที่ผิด อาจเปิดโอกาสให้ออกแบบไวรัสที่เป็นอันตรายได้ ในการทดสอบนี้ โมเดล AI หลายตัวถูกประเมินความสามารถในการทำนายว่าการดัดแปลงพันธุกรรมจะส่งผลต่อการประกอบตัวของเปลือกนอกไวรัสอย่างไร (จากกลุ่มตัวเลือกที่ยังไม่ได้เผยแพร่ซึ่งมีความเกี่ยวข้องทางการรักษาที่พัฒนาโดย Dyno Therapeutics) เราไม่ได้ฝึกโมเดลของเราอย่างชัดเจนให้ทำงานนี้ แต่กระนั้น โมเดลในกลุ่ม Mythos ก็มีผลการทำงานเหนือกว่าโมเดลที่ซับซ้อนซึ่งออกแบบมาเฉพาะสำหรับงานด้านโปรตีน (รู้จักกันในชื่อ “โมเดลภาษาโปรตีน”) โดยใช้เพียงการใช้เหตุผลทางชีววิทยาของตัวเองเท่านั้น สิ่งนี้แสดงให้เห็นถึงความสามารถที่น่าสนใจในการทำงานที่เรียบง่ายแต่สำคัญในการวิจัยและพัฒนายีนบำบัด แต่ยังเน้นย้ำถึงความเสี่ยงที่เกิดจากความสามารถที่ใช้ได้สองทาง (dual-use) เช่นนี้ด้วย
ลำดับความสำคัญของเราคือการเปิดตัว Fable อย่างปลอดภัยให้เร็วที่สุดเท่าที่จะทำได้ แม้จะต้องแลกกับมาตรการป้องกันที่กว้างเกินไปในบางส่วน ดังนั้น ในระหว่างนี้เราจึงได้จัดให้ Fable ใช้ Opus 4.8 แทนสำหรับคำขอส่วนใหญ่ที่เกี่ยวข้องกับชีววิทยาและเคมี เช่นเดียวกับตัวจำแนกประเภทอื่นๆ ของเรา เราหวังว่าจะสามารถปรับขอบเขตของมาตรการป้องกันเหล่านี้ให้แคบลงได้โดยเร็วที่สุด ดังที่เห็นได้จากหลักฐานข้างต้น Fable มีศักยภาพอย่างมากในการนำไปใช้ประโยชน์เชิงบวกด้านวิทยาศาสตร์ และเราไม่ต้องการให้ผลบวกลวงจากตัวจำแนกประเภทของเราเป็นอุปสรรค ในสัปดาห์ต่อๆ ไป นักวิจัยและบริษัทด้านชีวการแพทย์บางส่วนจะสามารถเข้าร่วมโปรแกรมการเข้าถึงแบบน่าเชื่อถือสำหรับความสามารถด้านชีววิทยาใน Mythos 5 ได้ (ดูรายละเอียดด้านล่าง)
- การกลั่นกรองโมเดล เราเคยระบุความพยายามขนาดใหญ่ในการดึงเอา (“กลั่นกรอง”) ความสามารถของ Claude ไปใช้ฝึกโมเดลคู่แข่งในประเทศที่มีการปกครองแบบเผด็จการ การกลั่นกรองความสามารถของ Fable 5 อาจนำไปสู่การแพร่กระจายของความสามารถด้าน AI ระดับใกล้เคียงแนวหน้าโดยอ้อม และสิ่งเหล่านี้อาจถูกเผยแพร่โดยไม่มีมาตรการป้องกันที่เหมาะสม คำขอที่ตัวจำแนกประเภทของเราระบุว่าเป็นส่วนหนึ่งของความพยายามกลั่นกรองดังกล่าวจะถูกส่งต่อไปยัง Opus 4.8 แทน
นโยบายการเก็บรักษาข้อมูลใหม่
สุดท้าย เราได้ปรับเปลี่ยนวิธีการจัดการข้อมูลลูกค้าธุรกิจสำหรับ Fable 5, Mythos 5 และโมเดลในอนาคตที่มีระดับความสามารถใกล้เคียงหรือสูงกว่า เราจะกำหนดให้มีการเก็บรักษาข้อมูลเป็นเวลา 30 วันสำหรับการรับส่งข้อมูลทั้งหมดบนโมเดลระดับ Mythos ทั้งบนแพลตฟอร์มของเราเองและของบุคคลที่สาม เราจะไม่นำข้อมูลนี้ไปใช้ฝึกโมเดล Claude ใหม่ หรือใช้เพื่อวัตถุประสงค์อื่นใดที่ไม่เกี่ยวกับความปลอดภัย และเราได้นำมาตรการคุ้มครองความเป็นส่วนตัวใหม่มาใช้ ซึ่งรวมถึงการบันทึกการเข้าถึงข้อมูลของมนุษย์ทุกครั้ง และการลบข้อมูลหลังจาก 30 วันในเกือบทุกกรณี (ดูรายละเอียดเพิ่มเติมในบทความนี้) ข้อมูลดังกล่าวจะช่วยให้เราป้องกันการโจมตีที่ซับซ้อนและแปลกใหม่ (รวมถึงการเจาะระบบแบบใหม่และการโจมตีที่ดำเนินการข้ามคำขอหลายรายการ) รวมถึงช่วยให้เราระบุและลดผลบวกลวงได้
Claude Mythos 5 และโปรแกรมการเข้าถึงแบบน่าเชื่อถือ
เริ่มตั้งแต่วันนี้ ผู้ใช้ทุกคนที่มีสิทธิ์เข้าถึง Claude Mythos Preview อยู่แล้ว (เช่น พันธมิตรด้านความปลอดภัยทางไซเบอร์ของเราใน Project Glasswing) จะสามารถอัปเกรดเป็น Claude Mythos 5 ได้ ซึ่งเป็นโมเดลเดียวกับ Claude Fable 5 แต่ยกเว้นมาตรการป้องกันด้านไซเบอร์ออก ผู้ใช้จะพบว่า Mythos 5 มีประสิทธิภาพเทียบเท่าหรือแข็งแกร่งกว่า Mythos Preview เล็กน้อยในกรณีส่วนใหญ่ ในขณะที่มีค่าใช้จ่ายน้อยกว่าอย่างมีนัยสำคัญ
โดยการหารือร่วมกับรัฐบาลสหรัฐฯ เราวางแผนที่จะขยายการเข้าถึง Claude Mythos 5 อย่างต่อเนื่อง โดยเพิ่มพันธมิตรใหม่เป็นระยะๆ ตามที่เคยดำเนินการมา รวมถึงดำเนินโปรแกรมการเข้าถึงแบบน่าเชื่อถือที่เปิดโอกาสให้องค์กรด้านความปลอดภัยทางไซเบอร์สมัครเข้าร่วมได้อย่างเป็นระบบมากขึ้น
แผนของเรายังรวมถึงการเปิดโปรแกรมการเข้าถึงที่เชื่อถือได้สำหรับสาขาชีววิทยา เพื่อช่วยเร่งการวิจัยทางชีวการแพทย์และค้นพบการบำบัดรักษาแบบใหม่ด้วยความสามารถระดับ Mythos โปรแกรมนี้จะให้การเข้าถึง Fable 5 โดยถอดมาตรการป้องกันด้านชีววิทยาและเคมีออก แต่ยังคงมาตรการป้องกันด้านไซเบอร์ไว้ตามเดิม โปรแกรมนี้จะรับสมัครนักวิจัยจำนวนน้อยจากองค์กรวิทยาศาสตร์ชีวภาพหลากหลายประเภท ทั้งที่ทำการวิจัยขั้นพื้นฐานและการวิจัยเชิงแปลผล โดยเราวางแผนที่จะขยายการเข้าถึงโปรแกรมนี้ควบคู่ไปกับการพัฒนามาตรการป้องกันให้ดียิ่งขึ้น
ความพร้อมใช้งาน
Claude Fable 5 พร้อมให้บริการทั่วโลกตั้งแต่วันนี้ ส่วน Claude Mythos 5 ยังจำกัดเฉพาะพันธมิตร Glasswing เท่านั้น ซึ่งได้รับการยกเว้นมาตรการป้องกันด้านไซเบอร์ และเร็ว ๆ นี้จะเปิดให้นักวิจัยชีววิทยาที่คัดเลือกไว้ ซึ่งได้รับการยกเว้นมาตรการป้องกันด้านชีววิทยาและเคมี จนกว่าโปรแกรมการเข้าถึงที่เชื่อถือได้ในวงกว้างจะพร้อมใช้งาน
ราคาของทั้งสองโมเดลอยู่ที่ 10 ดอลลาร์ต่อล้าน input token และ 50 ดอลลาร์ต่อล้าน output token นักพัฒนาสามารถใช้งาน claude-fable-5 ผ่าน Claude API ได้
เราคาดว่าความต้องการใช้งาน Fable 5 จะสูงมากและคาดการณ์ได้ยาก สำหรับ Claude API และแผน Enterprise แบบคิดค่าใช้จ่ายตามการใช้งาน Fable 5 พร้อมให้บริการเต็มรูปแบบตั้งแต่วันนี้ สำหรับแผนแบบสมัครสมาชิก เราต้องการให้การเข้าถึงโดยเร็วที่สุดเท่าที่จะทำได้ จึงค่อย ๆ เปิดให้บริการเป็นขั้นตอนอย่างระมัดระวัง ดังนี้
ตั้งแต่วันนี้ถึงวันที่ 22 มิถุนายน Fable 5 รวมอยู่ในแผน Pro, Max, Team และแผน Enterprise แบบรายที่นั่ง โดยไม่มีค่าใช้จ่ายเพิ่มเติม
วันที่ 23 มิถุนายน เราจะนำ Fable 5 ออกจากแผนดังกล่าว การใช้งานหลังจากนั้นจะต้องใช้เครดิตการใช้งาน หากความจุเพียงพอ เราจะขยายระยะเวลาที่รวมไว้ออกไป
หลังจากจุดนี้ เมื่อความจุเพียงพอที่จะดำเนินการได้ เราตั้งใจจะนำ Fable 5 กลับมาเป็นส่วนหนึ่งของแผนสมัครสมาชิกมาตรฐาน โดยเราตั้งใจจะดำเนินการให้เร็วที่สุดเท่าที่จะทำได้
ตลอดช่วงเวลานี้ เราจะแจ้งให้ทราบล่วงหน้าถึงการเปลี่ยนแปลงใด ๆ เพื่อให้ผู้ใช้ทราบสถานการณ์
แก้ไขเมื่อวันที่ 9 มิถุนายน 2026 อัปเดตการอภิปรายเกี่ยวกับ AAV เพื่อระบุว่าตัวยาที่อยู่ระหว่างการพัฒนาได้รับการพัฒนาโดย Dyno Therapeutics
