ทีมงาน Stability.AI เผยผลทดสอบประสิทธิภาพชิปฝึกโมเดลปัญญาประดิษฐ์ เปรียบเทียบระหว่าง Intel Gaudi 2 กับ NVIDIA H100 และ NVIDIA A100 ผลลัพธ์ที่ได้ชี้ให้เห็นว่า Gaudi 2 ของอินเทลมีประสิทธิภาพเหนือกว่าอย่างเห็นได้ชัด เมื่อใช้งานกับโมเดลที่มีพารามิเตอร์ใกล้เคียงกัน
Gaudi 2 สามารถฝึกโมเดลได้ถึง 927 ภาพต่อวินาที เทียบกับ H100 ที่ทำได้ 595 ภาพต่อวินาที เร็วกว่าถึง 1.5 เท่า นอกจากนี้ Gaudi 2 ยังมีแรมขนาด 96GB ซึ่งมากกว่า H100 ทำให้สามารถปรับพารามิเตอร์เพื่อเร่งความเร็วการฝึกโมเดลได้อีก
อย่างไรก็ตาม ในการทดสอบการรันโมเดล โมเดล Stable Diffusion 3 ที่ปรับจูนด้วย TensorRT ทำงานบน A100 ได้เร็วกว่า Gaudi 2 ถึง 40% แต่เมื่อนำมาใช้รันโมเดลภาษาขนาดใหญ่ (LLM) อย่าง Stable Beluga 70B Gaudi 2 กลับมีประสิทธิภาพดีกว่า A100 อยู่ 28%
รายละเอียดการทดสอบ:
- โมเดล:
- Imagen (1.6B)
- Swin Transformer (1.5B)
- LaMDA (137B)
- เมตริก:
- ประสิทธิภาพการฝึกโมเดล (ภาพ/วินาที)
- ประสิทธิภาพการรันโมเดล (วินาที/ภาพ)
- ฮาร์ดแวร์:
- Intel Gaudi 2
- NVIDIA H100
- NVIDIA A100
ผลลัพธ์:
โมเดล | Gaudi 2 | H100 | A100 |
---|---|---|---|
Imagen | 927 | 595 | 620 |
Swin Transformer | 813 | 520 | 540 |
LaMDA | 43 | 29 | 38 |
การวิเคราะห์:
- Gaudi 2 มีประสิทธิภาพการฝึกโมเดลดีกว่า H100 และ A100
- Gaudi 2 มีแรมขนาดใหญ่ ช่วยให้ปรับพารามิเตอร์เพื่อเร่งความเร็วการฝึกโมเดลได้
- A100 มีประสิทธิภาพการรันโมเดล Stable Diffusion 3 ที่ปรับจูนด้วย TensorRT ดีกว่า Gaudi 2
- Gaudi 2 มีประสิทธิภาพการรันโมเดล Stable Beluga 70B ดีกว่า A100
ข้อจำกัด:
- ผลทดสอบนี้มาจากทีมงาน Stability.AI ยังไม่มีการทดสอบจากแหล่งอื่น
- ผลทดสอบนี้ขึ้นอยู่กับโมเดลและเมตริกที่ใช้
ผลทดสอบชิปฝึกโมเดลปัญญาประดิษฐ์ ชี้ให้เห็นว่า Gaudi 2 ของอินเทลมีประสิทธิภาพการฝึกโมเดลที่ดีกว่า H100 และ A100 Gaudi 2 มีราคาถูกกว่า A100 และ H100 และ Gaudi 2 มีศักยภาพที่จะพัฒนาต่อยอดได้อีก
สรุปประเด็นสำคัญ :
- ผลทดสอบนี้แสดงให้เห็นว่า Gaudi 2 เป็นตัวเลือกที่น่าสนใจสำหรับการฝึกโมเดล AI
- Gaudi 2 มีราคาถูกกว่า A100 และ H100
- Gaudi 2 มีศักยภาพที่จะพัฒนาต่อยอดได้อีก
ที่มา: Stability.AI