A gigante chinesa AliBaba abriu o código do modelo de IA Wan 2.1, voltado para gerar vídeos, e liberou a tecnologia para todos. O anúncio foi feito pela empresa na última quarta-feira (26) com os repositórios disponíveis nas plataformas ModelScope, do Alibaba Cloud, e Hugging Face, que armazena diversos modelos de IA open source.
- DeepSeek, Qwen e mais: conheça 5 IAs chinesas
- 5 pontos para entender o DeepSeek, a IA chinesa concorrente do ChatGPT
O Wan 2.1 é o modelo mais avançado da companhia para vídeos até o momento e liderou testes de performance da plataforma VBench, com destaque para a interação entre múltiplos objetos, de acordo com informações da Reuters. O conjunto possui quatro variantes de diferentes tamanhos, incluindo uma com suporte a 14 bilhões de parâmetros, capaz de entender prompts mais longos.
Como usar o Wan 2.1
O Wan 2.1 pode criar vídeos de duas formas diferentes: a partir de um comando de texto ou de uma imagem estática. Todos os arquivos do modelo estão em código aberto, mas é possível testá-lo pelo Hugging Face.
–
Entre no Canal do WhatsApp do Canaltech e fique por dentro das últimas notícias sobre tecnologia, lançamentos, dicas e tutoriais incríveis.
–
As produções podem ser criadas na resolução 720p e o site apresenta uma fila de espera pra carregar os prompts:
- Acesse a página do Wan 2.1 no Hugging Face (huggingface.co/spaces/Wan-AI/Wan2.1);
- Insira o prompt desejado;
- Pressione “Generate Video”.
Wan 2.1 pode criar vídeos com muitos detalhes (Imagem: Reprodução/Hugging Face)
Respostas chinesas em código aberto
A China começou a ganhar protagonismo no mercado de IA generativa no começo do ano com a chegada do DeepSeek R1 e aposta em modelos de código aberto e baixo custo operacional como um diferencial.
O Wan 2.1 é construído com a licença Apache 2.0, que permite uso comercial e acadêmico. Vale lembrar que o Sora, IA de vídeos da OpenAI, está disponível apenas para assinantes de serviços pagos do ChatGPT.
Além disso, a AliBaba já anunciou anteriormente que desenvolve um modelo de IA de raciocínio chamado QwQ-Max e pretende liberá-lo em código aberto.
Leia também:
- O que é open source?
- IA Janus Pro, do DeepSeek, gera imagens e supera concorrentes; conheça
- Alexa+ leva IA generativa à assistente da Amazon; veja novidades
VÍDEO: no YouTube, o Canaltech avalia o preço do iPhone no Brasil
Leia a matéria no Canaltech.