24.5 C
Brasília
quinta-feira, 30 janeiro, 2025

A IA vai para o DeepSeek – Chineses fazem mais com menos

Michael Roberts [*]

A maior parte dos leitores já conhece a notícia. A DeepSeek, uma empresa chinesa de IA, lançou um modelo de IA chamado R1 que é comparável em capacidade aos melhores modelos de empresas como a OpenAI, Anthropic e Meta, mas foi treinado a um custo radicalmente inferior e utilizando menos do que os chips GPU de última geração. O DeepSeek também tornou público um número suficiente de pormenores do modelo para que outros o possam executar nos seus próprios computadores sem qualquer custo.

Logo do DeepSeek.

O DeepSeek é um torpedo que atingiu as Sete Magníficas empresas americanas de alta tecnologia abaixo da linha de água. A DeepSeek não utilizou os mais recentes e melhores chips e software da Nvidia; não exigiu grandes despesas para treinar o seu modelo de IA, ao contrário dos seus rivais americanos; e oferece o mesmo número de aplicações úteis.

Modelos de negócio: OpenAI e DeepSeek.

A DeepSeek construiu o seu R1 com os chips mais antigos e mais lentos da Nvidia, que as sanções dos EUA permitiram que fossem exportados para a China. O governo dos EUA e os titãs da tecnologia pensavam que tinham o monopólio do desenvolvimento da IA devido aos enormes custos envolvidos na produção de melhores chips e modelos de IA. Mas agora o R1 da DeepSeek sugere que as empresas com menos dinheiro podem em breve operar modelos de IA competitivos. O R1 pode ser utilizado com um orçamento reduzido e com muito menos capacidade de computação. Além disso, o R1 é tão bom como os seus rivais na “inferência”, o jargão da IA para quando os utilizadores questionam o modelo e obtêm respostas. E funciona em servidores para todo o tipo de empresas, para que não precisem de “alugar” a preços elevados a empresas como a OpenAI.

Mais importante ainda, o R1 do DeepSeek é “open source”, ou seja, os métodos de codificação e de treino estão abertos a todos para serem copiados e desenvolvidos. Isto é um verdadeiro golpe para os segredos “proprietários” que a OpenAI ou o Gemini da Google guardam numa “caixa negra” a fim de maximizar os lucros. A analogia aqui é com os produtos farmacêuticos de marca e genéricos.

A grande questão para as empresas americanas de IA e para os seus investidores é que, aparentemente, a construção de enormes datas centres para alojar múltiplos chips dispendiosos pode não ser necessária para obter resultados suficientemente positivos. Até à data, as empresas norte-americanas têm aumentado os seus planos de despesa e tentado angariar grandes quantias de financiamento para o fazer. De facto, na mesma segunda-feira em que o R1 da DeepSeek foi notícia, a Meta anunciou mais 65 mil milhões de dólares de investimento e, apenas alguns dias antes, o Presidente Trump anunciara subsídios governamentais de 500 mil milhões de dólares para os gigantes da tecnologia como parte do chamado projeto Stargate. Ironicamente, o presidente executivo da Meta, Mark Zuckerberg, disse que estava a investir porque “queremos que os EUA estabeleçam o padrão global de IA, não a China”. Oh, meu Deus.

Agora, os investidores estão preocupados com o facto de esta despesa ser desnecessária e, mais concretamente, com o facto de poder afetar a rentabilidade das empresas americanas se a DeepSeek conseguir fornecer aplicações de IA a um décimo do custo. Cinco das maiores ações tecnológicas orientadas para a IA – o fabricante de chips Nvidia e os chamados “hiperescaladores” Alphabet, Amazon, Microsoft e Meta Platforms – perderam coletivamente quase 750 mil milhões de dólares do seu valor bolsista num só dia. E o DeepSeek ameaça, de facto, os lucros das empresas de data centres e dos operadores de água e energia que esperam beneficiar com o enorme “aumento de escala” dos Sete Magníficos. O boom do mercado de ações dos EUA está fortemente concentrado nos “Sete Magníficos”.

Então, terá a DeepSeek furado a enorme bolha do mercado bolsista das ações tecnológicas dos EUA? O investidor multimilionário Ray Dalio acha que sim. Em entrevista ao Financial Times, Dalio afirma que “os preços atingiram níveis elevados, ao mesmo tempo que existe um risco de taxa de juro, e essa combinação pode furar a bolha… A situação atual do ciclo é muito semelhante à que existia entre 1998 e 1999”. “Por outras palavras, existe uma nova tecnologia importante que certamente mudará o mundo e será bem sucedida. Mas algumas pessoas estão a confundir isso com o êxito dos investimentos”.

Mas esse pode não ser o caso, pelo menos por enquanto. O preço das ações da empresa de chips de IA Nvidia pode ter caído esta semana, mas a sua linguagem de codificação “proprietária”, Cuda, continua a ser o padrão da indústria dos EUA. Embora as suas ações tenham caído quase 17%, isso apenas as faz regressar ao nível (muito, muito elevado) de setembro.

Muito dependerá de outros fautores, como a manutenção das taxas de juro elevadas pela Reserva Federal dos EUA, devido a uma inversão da queda da inflação, e do facto de Trump avançar em força com as suas ameaças tarifárias e de imigração, que só alimentarão a inflação.

O que deve enfurecer os oligarcas tecnológicos que apoiam Trump é o facto de as sanções impostas pelos EUA às empresas chinesas e as proibições à exportação de chips não terem impedido a China de fazer mais avanços na guerra tecnológica e de chips com os EUA. A China está a conseguir dar saltos tecnológicos na IA, apesar dos controlos de exportação introduzidos pela administração Biden, destinados a privá-la tanto dos chips mais poderosos como das ferramentas avançadas necessárias para os fabricar.

A campeã tecnológica chinesa Huawei surgiu como a principal concorrente da Nvidia na China para os chips de “inferência”. E tem estado a trabalhar com empresas de IA incluindo a DeepSeek, para adaptar modelos treinados em GPUs da Nvidia para executar inferência nos seus chips Ascend. “A Huawei está a melhorar. Eles têm uma abertura, pois o governo está dizendo às grandes empresas de tecnologia que precisam comprar seus chips e usá-los para inferência ”, disse um investidor de semicondutores em Pequim.

Esta é mais uma demonstração de que o investimento planeado pelo Estado na tecnologia e nas competências tecnológicas da China funciona muito melhor do que depender de grandes gigantes tecnológicos privados liderados por magnatas. Como disse Ray Dallo: “No nosso sistema, em geral, estamos a mudar para uma política de tipo mais complexo industrial, em que haverá atividade mandatada pelo governo e influenciada pelo governo, porque é muito importante… O capitalismo sozinho – o motivo do lucro sozinho – não pode vencer esta batalha”.

No entanto, os titãs da IA ainda não são o Titanic. Estão a avançar com o “aumento de escala”, investindo cada vez mais milhares de milhões em centros de dados e chips mais avançados. Isto está a aumentar exponencialmente a potência dos computadores.

E, claro, não se tem em conta aquilo a que os economistas tradicionais gostam educadamente de chamar “externalidades”. De acordo com um relatório da Goldman Sachs, uma consulta no ChatGPT necessita de quase 10 vezes mais eletricidade do que uma consulta de pesquisa no Google. O investigador Jesse Dodge fez algumas contas de trás para a frente sobre a quantidade de energia que os chatbots de IA utilizam. “Uma consulta ao ChatGPT consome aproximadamente a mesma quantidade de eletricidade que poderia acender uma lâmpada durante cerca de 20 minutos”, afirma. “Por isso, pode imaginar que, com milhões de pessoas a utilizar algo assim todos os dias, isso representa uma enorme quantidade de eletricidade”. Mais consumo de eletricidade significa mais produção de energia e, em particular, mais emissões de gases com efeito de estufa [NR] provenientes de combustíveis fósseis.

A Google tem o objetivo de atingir emissões líquidas nulas até 2030. Desde 2007, a empresa tem afirmado que as suas operações são neutras em termos de carbono devido às compensações de carbono que compra para compensar as suas emissões. Mas, a partir de 2023, o Google escreveu em seu relatório de sustentabilidade que não estava mais “mantendo a neutralidade operacional de carbono”. A empresa diz que ainda está pressionando por sua meta de zero líquido em 2030. “A verdadeira motivação do Google aqui é construir os melhores sistemas de IA que puderem”, diz Dodge. “E eles estão dispostos a despejar uma tonelada de recursos nisso, incluindo coisas como treinar sistemas de IA em centros de dados cada vez maiores até supercomputadores, o que incorre em uma enorme quantidade de consumo de eletricidade e, portanto, emissões de CO2”,

Depois há a água. Enquanto os EUA enfrentam secas e incêndios florestais, as empresas de IA estão a sugar águas profundas para “arrefecer” os seus megacentros de dados e proteger os chips. Mais do que isso, as empresas de Silicon Valley estão a assumir cada vez mais o controlo das infraestruturas de abastecimento de água para satisfazer as suas necessidades. A investigação sugere, por exemplo, que poderiam ter sido utilizados cerca de 700 mil litros de água para arrefecer as máquinas que treinaram o ChatGPT-3 nas instalações de dados da Microsoft.

O treino de modelos de IA consome 6 000 vezes mais energia do que uma cidade europeia. Além disso, embora minerais como o lítio e o cobalto sejam mais frequentemente associados às baterias do sector automóvel, são também cruciais para as baterias utilizadas nos centros de dados. O processo de extração envolve frequentemente uma utilização significativa de água e pode levar à poluição, comprometendo a segurança [do abastecimento de] água.

Sam Altman, o anterior herói sem fins lucrativos da Open AI, mas agora empenhado em maximizar lucros para a Microsoft, argumenta que sim, infelizmente existem “trade-offs” a curto prazo, mas que são necessárias para alcançar a chamada AGI; e a AGI ajudar-nos-á a resolver todos estes problemas, pelo que o trade-off de “externalidades” vale a pena.

AGI? O que é isso? A inteligência artificial generalizada (Artifical generalised intelligence, AGI) é o Santo Graal dos criadores de IA. Significa que os modelos de IA tornar-se-ão “superinteligentes”, muito acima da inteligência humana. Quando isso for conseguido, promete Altman, a sua IA não será apenas capaz de fazer o trabalho de um único trabalhador, será capaz de fazer todos os seus trabalhos:   “A IA pode fazer o trabalho de uma organização”. Esta seria a derradeira forma de maximizar a rentabilidade, eliminando os trabalhadores das empresas (mesmo das empresas de IA?), à medida que as próprias máquinas de IA se encarregam de operar, desenvolver e comercializar tudo. Este é o sonho apocalítico para o capital (mas um pesadelo para o trabalho: não emprego, não rendimento).

É por isso que Altman e os outros magnatas da IA não vão parar de expandir os seus centros de dados e de desenvolver chips ainda mais avançados, só porque o DeepSeek desvalorizou os seus modelos atuais. A empresa de investigação Rosenblatt prevê a reação dos gigantes da tecnologia:   “De um modo geral, esperamos que a tendência seja para melhorar as capacidades, acelerando em direção à inteligência artificial geral, mais do que para reduzir as despesas”. Nada deve impedir o objetivo de uma IA superinteligente. Há quem veja a corrida para alcançar a AGI como uma ameaça à própria humanidade. Stuart Russell, professor de ciências informáticas na Universidade da Califórnia, em Berkeley, afirmou:   “Até os diretores executivos que estão a participar na corrida afirmaram que quem ganhar tem uma probabilidade significativa de causar a extinção humana no processo, porque não temos ideia de como controlar sistemas mais inteligentes do que nós”, disse. “Por outras palavras, a corrida AGI é uma corrida à beira de um precipício”.

Talvez, mas continuo a duvidar que a “inteligência” humana possa ser substituída pela inteligência das máquinas, sobretudo porque são diferentes. As máquinas não conseguem pensar em mudanças potenciais e qualitativas. O novo conhecimento provém dessas transformações (humanas), não da extensão do conhecimento existente (máquinas). Só a inteligência humana é social e consegue ver o potencial de mudança, em particular a mudança social, que conduz a uma vida melhor para a humanidade e para a natureza.

O que o aparecimento do DeepSeek demonstrou é que a IA pode ser desenvolvida a um nível que pode ajudar a humanidade e as suas necessidades sociais. É gratuita e aberta e está disponível para o mais pequeno utilizador e programador. Não foi desenvolvida com fins lucrativos ou para obter um lucro. Como disse um comentador:   “Quero que a IA lave a minha roupa e a minha loiça para que eu possa fazer arte e escrever, e não que a IA faça a minha arte e escrita para que eu possa lavar a minha roupa e a minha loiça”. Os gestores estão a introduzir a IA para “facilitar os problemas de gestão à custa de coisas para as quais muitas pessoas acham que a IA não deveria ser utilizada, como o trabalho criativo. Se a IA vai funcionar, tem de vir de baixo para cima, ou a IA será inútil para a grande maioria das pessoas nos locais de trabalho”.

Ao invés de desenvolver a IA para obter lucros, reduzir os postos de trabalho e os meios de subsistência dos seres humanos, a IA, sob propriedade e planeamento comuns, poderia reduzir as horas de trabalho humano para todos e libertar os seres humanos do trabalho árduo a fim de se concentrarem no trabalho criativo que só a inteligência humana pode realizar. Recorde-se que o “Santo Graal” era uma ficção vitoriana e, mais tarde, também uma ficção de Dan Brown.

[NR] Um falso problema, como tem sido apontado por resistir.info.

28/Janeiro/2025

[*] Economista.

O original encontra-se em thenextrecession.wordpress.com/2025/01/28/ai-going-deepseek/

Este artigo encontra-se em resistir.info

 

ÚLTIMAS NOTÍCIAS