DeepSeek wydał DeepSeek-V3.1, zaktualizowaną wersję swojego przełomowego modelu sztucznej inteligencji uruchomionego w grudniu 2024 r., Który natychmiast znalazł się w pierwszej dziesiątce najpotężniejszych modeli sztucznej inteligencji dostępnych na całym świecie.
Firma zaskoczyła świat, szczegółowo opisując, w jaki sposób wytrenowała model przy użyciu znacznie mniejszej ilości zasobów obliczeniowych przy niższych kosztach niż konkurencyjne modele. Najnowsza wersja działa jako hybrydowy model sztucznej inteligencji, łącząc szybszy model niemyślący, z którego znany był DeepSeek V3, z wolniejszym modelem myślącym, z którego znany był DeepSeek R1.
Najnowszy model DeepSeek AI LLM jest dostępny do bezpłatnego pobrania pod adresem https://huggingface.co/deepseek-ai/DeepSeek-V3.1 na licencji open-source MIT. Czytelnicy chcący poeksperymentować z pełnym modelem 671B DeepSeek-V3.1 będą potrzebować co najmniej 720 GB wolnej przestrzeni dyskowej (lub 170GB dla 1-bitowej wersji kwantyzowanej)). Najmniejszy model kwantyzowany będzie wymagał wydajnego procesora graficznego z co najmniej 24 GB pamięci, takiego jak ten procesor graficzny Nvidia 5090 z 32 GB pamięci na Amazon.
Zaktualizowany model DeepSeek-V3.1 poprawia zdolność kodowania wcześniejszych niemyślących modeli V3 i myślących modeli R1, zgodnie z wynikami w teście SWE-bench. Osiąga również lepsze wyniki w innych testach porównawczych AI w trybie myślenia niż poprzedni model R1, w tym xbench-DeepSearch, SimpleQAi FRAMES AI.
Sztuczna inteligencja V3.1 ma okno tokenów 128K, a ceny dostępu do API zostaną uproszczone po 5 września 2025 r., aby uwzględnić jej hybrydowy charakter. Czytelnicy mogą czatować ze sztuczną inteligencją DeepSeek-V3.1 za darmo.