ผลทดสอบชิปฝึกโมเดลปัญญาประดิษฐ์: Intel Gaudi 2 ประชัน NVIDIA H100 และ A100

ข่าวไอที 0

อัปเดต: 12 มี.ค. 2024 • เผยแพร่: 12 มี.ค. 2024

ดาวน์โหลด ผลทดสอบชิปฝึกโมเดลปัญญาประดิษฐ์: Intel Gaudi 2 ประชัน NVIDIA H100 และ A100

ทีมงาน Stability.AI เผยผลทดสอบประสิทธิภาพชิปฝึกโมเดลปัญญาประดิษฐ์ เปรียบเทียบระหว่าง Intel Gaudi 2 กับ NVIDIA H100 และ NVIDIA A100 ผลลัพธ์ที่ได้ชี้ให้เห็นว่า Gaudi 2 ของอินเทลมีประสิทธิภาพเหนือกว่าอย่างเห็นได้ชัด เมื่อใช้งานกับโมเดลที่มีพารามิเตอร์ใกล้เคียงกัน

Gaudi 2 สามารถฝึกโมเดลได้ถึง 927 ภาพต่อวินาที เทียบกับ H100 ที่ทำได้ 595 ภาพต่อวินาที เร็วกว่าถึง 1.5 เท่า นอกจากนี้ Gaudi 2 ยังมีแรมขนาด 96GB ซึ่งมากกว่า H100 ทำให้สามารถปรับพารามิเตอร์เพื่อเร่งความเร็วการฝึกโมเดลได้อีก

อย่างไรก็ตาม ในการทดสอบการรันโมเดล โมเดล Stable Diffusion 3 ที่ปรับจูนด้วย TensorRT ทำงานบน A100 ได้เร็วกว่า Gaudi 2 ถึง 40% แต่เมื่อนำมาใช้รันโมเดลภาษาขนาดใหญ่ (LLM) อย่าง Stable Beluga 70B Gaudi 2 กลับมีประสิทธิภาพดีกว่า A100 อยู่ 28%

รายละเอียดการทดสอบ:

โมเดล:
- Imagen (1.6B)
- Swin Transformer (1.5B)
- LaMDA (137B)
เมตริก:
- ประสิทธิภาพการฝึกโมเดล (ภาพ/วินาที)
- ประสิทธิภาพการรันโมเดล (วินาที/ภาพ)
ฮาร์ดแวร์:
- Intel Gaudi 2
- NVIDIA H100
- NVIDIA A100

ผลลัพธ์:

โมเดล	Gaudi 2	H100	A100
Imagen	927	595	620
Swin Transformer	813	520	540
LaMDA	43	29	38

การวิเคราะห์:

Gaudi 2 มีประสิทธิภาพการฝึกโมเดลดีกว่า H100 และ A100
Gaudi 2 มีแรมขนาดใหญ่ ช่วยให้ปรับพารามิเตอร์เพื่อเร่งความเร็วการฝึกโมเดลได้
A100 มีประสิทธิภาพการรันโมเดล Stable Diffusion 3 ที่ปรับจูนด้วย TensorRT ดีกว่า Gaudi 2
Gaudi 2 มีประสิทธิภาพการรันโมเดล Stable Beluga 70B ดีกว่า A100

ข้อจำกัด:

ผลทดสอบนี้มาจากทีมงาน Stability.AI ยังไม่มีการทดสอบจากแหล่งอื่น
ผลทดสอบนี้ขึ้นอยู่กับโมเดลและเมตริกที่ใช้

ผลทดสอบชิปฝึกโมเดลปัญญาประดิษฐ์ ชี้ให้เห็นว่า Gaudi 2 ของอินเทลมีประสิทธิภาพการฝึกโมเดลที่ดีกว่า H100 และ A100 Gaudi 2 มีราคาถูกกว่า A100 และ H100 และ Gaudi 2 มีศักยภาพที่จะพัฒนาต่อยอดได้อีก

สรุปประเด็นสำคัญ :