DeepSeek Tersandung di Huawei Ascend, R2 Tetap Andalkan GPU Nvidia
DeepSeek alami kendala besar latih model AI R2 di Huawei Ascend, terpaksa kembali ke GPU Nvidia untuk pelatihan.

Padang - Perusahaan AI asal Tiongkok, DeepSeek, dilaporkan mengalami hambatan serius saat mencoba melatih model terbaru mereka, R2, menggunakan perangkat keras Huawei Ascend. Menurut laporan Financial Times, upaya ini awalnya dilakukan atas dorongan otoritas Tiongkok yang ingin mengurangi ketergantungan pada teknologi Nvidia. Namun, masalah teknis berulang membuat proyek terpaksa kembali mengandalkan chip Nvidia untuk proses pelatihan.
Dorongan untuk Beralih ke Teknologi Lokal
Setelah sukses meluncurkan model AI R1 yang dilatih sepenuhnya menggunakan GPU Nvidia, DeepSeek dikabarkan diminta pemerintah untuk memanfaatkan platform Ascend milik Huawei pada generasi berikutnya. Harapannya, langkah ini dapat memperkuat ekosistem teknologi dalam negeri sekaligus mengurangi risiko akibat pembatasan ekspor chip canggih dari Amerika Serikat.
Tiga sumber yang mengetahui langsung proses tersebut mengatakan, DeepSeek mengikuti arahan itu saat mengembangkan R2. Namun, keputusan ini justru memunculkan masalah mulai dari performa yang tidak stabil, lambatnya konektivitas antar-chip, hingga keterbatasan perangkat lunak CANN yang menjadi inti dari ekosistem Huawei Ascend.
Kembali ke Nvidia untuk Latihan, Huawei untuk Inferensi
Karena masalah tersebut tak kunjung terselesaikan, DeepSeek akhirnya mengambil langkah kompromi: kembali menggunakan akselerator AI Nvidia untuk melatih R2, sementara perangkat keras Huawei tetap dipakai untuk proses inferensi. Strategi ini bukanlah pilihan ideal, melainkan kebutuhan mendesak di tengah keterbatasan stok GPU Nvidia di Tiongkok.
Pendekatan ini juga dianggap masuk akal secara bisnis. Banyak pelanggan DeepSeek yang menggunakan infrastruktur Huawei Ascend untuk menjalankan model AI, sehingga memastikan kompatibilitas R2 di platform tersebut menjadi hal krusial.
Upaya Huawei Mengatasi Masalah
Huawei disebut telah mengirim tim insinyur ke pusat data DeepSeek untuk mengatasi masalah pelatihan di Ascend. Meski begitu, hingga kini belum ada laporan keberhasilan penuh dalam menjalankan sesi pelatihan R2 di platform tersebut. Fokus saat ini adalah memastikan R2 dapat berjalan optimal pada Ascend untuk keperluan inferensi, meskipun pelatihan utamanya dilakukan di GPU Nvidia.
Kegagalan menyelesaikan pelatihan di Ascend menjadi salah satu alasan utama penundaan peluncuran R2 yang awalnya dijadwalkan pada Mei. Kekurangan pasokan GPU Nvidia berkinerja tinggi di Tiongkok juga memperburuk situasi, sehingga jadwal rilis semakin mundur. Status terbaru mengenai pra-pelatihan penuh R2 masih belum jelas.
Tantangan Besar di Balik R2
Model R1 sebelumnya dilatih menggunakan kluster besar berisi 50.000 GPU seri Hopper terdiri dari 30.000 unit HGX H20, 10.000 H800, dan 10.000 H100 yang disediakan melalui investor DeepSeek, High-Flyer Capital Management. Mengingat R2 diperkirakan akan jauh lebih kompleks, kebutuhan daya komputasi untuk pelatihannya pun meningkat drastis.
Selain tantangan teknis, DeepSeek menghadapi masalah strategis: platform AI mereka telah dioptimalkan secara khusus untuk perangkat keras Nvidia. Kondisi ini membuat perusahaan rentan terhadap kelangkaan GPU Nvidia dan membuat pelanggan bergantung pada ketersediaan chip tersebut. Inilah sebabnya pengujian dan optimasi R2 di Huawei Ascend dianggap penting sebagai langkah diversifikasi teknologi.
Mengamankan Masa Depan AI Tiongkok
Kasus DeepSeek menjadi gambaran jelas bahwa transisi dari teknologi asing ke solusi domestik tidak selalu mulus. Meski memiliki tujuan strategis untuk kemandirian teknologi, kendala teknis yang dihadapi menunjukkan bahwa diperlukan investasi lebih besar dalam pengembangan perangkat keras dan perangkat lunak AI lokal agar mampu bersaing dengan raksasa global seperti Nvidia.
Jika masalah kompatibilitas dan performa Huawei Ascend dapat diatasi, R2 bisa menjadi tonggak penting bagi industri AI Tiongkok. Namun, untuk saat ini, Nvidia masih memegang peran sentral dalam pelatihan model AI berskala besar di negara tersebut.
What's Your Reaction?






