A DeepSeek, startup chinesa que recentemente abalou o mercado com sua IA generativa homônima, pode ter gasto muito mais do que os US$ 6 milhões (R 34,9 milhões) inicialmente divulgados para desenvolver sua tecnologia. Segundo um relatório da empresa de análise SemiAnalysis, o investimento total na infraestrutura de IA da DeepSeek pode ter ultrapassado US$ 1,6 bilhão (R 9,3 bilhões), incluindo a aquisição de 50 mil GPUs da NVIDIA.
Originalmente, a DeepSeek afirmou ter usado apenas 2.048 GPUs para treinar seu modelo, mas essa informação vem sendo questionada. O relatório da SemiAnalysis revela que a infraestrutura da empresa é composta por 10 mil placas H100, 10 mil GPUs H800 e as restantes seriam placas H20. Esses equipamentos estão distribuídos em vários locais, sendo utilizados para treinamento do chatbot, pesquisa e modelagem financeira.
Custos subestimados
O levantamento indica que os números divulgados pela DeepSeek cobrem apenas uma parte dos gastos, relacionados ao período de pré-treinamento. Custos adicionais com pesquisa, refinamento de modelos, processamento de dados e despesas gerais de infraestrutura não foram incluídos nas estimativas iniciais.
Independência e eficiência
Diferente de muitas empresas do setor, a DeepSeek opera seus próprios data centers, em vez de depender de soluções de nuvem externas. Essa independência permite um controle maior sobre os modelos de IA, aumentando a eficiência em comparação com concorrentes.
Atração de talentos
Outro destaque da DeepSeek é sua estratégia de contratação. A startup prioriza a contratação de profissionais formados em instituições de elite chinesas, como a Universidade de Pequim e a Universidade de Zhejiang, oferecendo pacotes salariais altamente competitivos.
De acordo com a SemiAnalysis, pesquisadores de IA na DeepSeek podem ganhar até US$ 1,3 milhão por ano (equivalente a R$ 7,6 milhões), superando os salários oferecidos por outras startups locais, como a Moonshot AI.