Microsoft lança modelos de IA próprios e promete respostas mais rápidas no Copilot

IA

A divisão de inteligência artificial da Microsoft apresentou nesta quinta-feira (28) seus primeiros modelos desenvolvidos internamente. Batizados de MAI-Voice-1 e MAI-1-preview, os sistemas chegam para ampliar o leque de recursos do assistente Copilot e posicionar a empresa em disputa direta com soluções como GPT-5 e DeepSeek.

Dois modelos, duas finalidades distintas

O MAI-Voice-1 foi projetado para síntese de voz. Segundo a Microsoft, o modelo consegue gerar até um minuto de áudio em menos de um segundo utilizando apenas uma GPU, desempenho que reduz custos de processamento e permite respostas quase instantâneas. A companhia já utiliza o recurso em funcionalidades como o Copilot Daily, que apresenta as principais notícias do dia, e em discussões no formato de podcast que ajudam a explicar assuntos complexos ao usuário.

Quem quiser testar o MAI-Voice-1 pode acessar o Copilot Labs, escolher o texto a ser narrado e ajustar voz ou estilo de fala. A empresa afirma que o objetivo é oferecer ao público final um assistente capaz de conversar de maneira natural, sem depender exclusivamente de modelos de parceiros externos.

Já o MAI-1-preview é voltado para tarefas de texto. Treinado em aproximadamente 15 mil GPUs Nvidia H100, ele foi concebido para seguir instruções, responder perguntas e auxiliar em dúvidas do dia a dia. Embora ainda esteja em fase preliminar, a Microsoft iniciou testes públicos na plataforma de benchmarking LMArena e planeja integrar o modelo a fluxos específicos do Copilot que atualmente recorrem à tecnologia da OpenAI.

Estrategia foca no consumidor final

Mustafa Suleyman, chefe da Microsoft AI, reiterou que o esforço interno prioriza casos de uso voltados ao consumidor. Em entrevista ao podcast Decoder, o executivo explicou que a empresa dispõe de grandes volumes de dados preditivos obtidos a partir de anúncios e telemetria de produtos, material que pode melhorar a capacidade do assistente de compreender necessidades cotidianas. “Meu foco é construir modelos que realmente funcionem como um companheiro do usuário”, afirmou.

Com as novas soluções, a Microsoft pretende orquestrar diferentes modelos especializados conforme a intenção do usuário. A expectativa é que essa abordagem eleve a qualidade das respostas, dispense chamadas redundantes a grandes modelos generalistas e gere economia operacional.

Além da utilização no Copilot, a companhia avalia cenários de adoção dos modelos em produtos de áudio, plataformas de reunião e ferramentas de acessibilidade. Não foram divulgados prazos para a liberação definitiva do MAI-1-preview, mas a empresa sinalizou que a ferramenta será expandida gradualmente durante os próximos meses.

A aposta em modelos próprios adiciona uma nova dinâmica à parceria com a OpenAI. Embora continue licenciando tecnologias como o GPT-4o, a Microsoft passa a ter alternativas internas para determinados fluxos, garantindo maior controle sobre custos de inferência e privacidade dos dados.

Para quem acompanha as novidades do setor, a iniciativa pode indicar uma tendência de verticalização entre grandes provedoras de nuvem, que buscam reduzir dependências externas e diferenciar seus portfólios de IA.

Se você quer entender como outros gigantes do mercado estão avançando em inteligência artificial, vale conferir as notícias na seção de tecnologia do nosso site em https://remansonoticias.com.br/category/tecnologia.

Em resumo, a Microsoft reforça sua estratégia de IA com dois modelos internos: um especializado em voz e outro focado em texto. A medida deve aprimorar a experiência no Copilot, reduzir latências e oferecer à empresa mais autonomia frente a concorrentes. Fique atento às atualizações e experimente as novas funções quando estiverem disponíveis.

Curiosidade

Apesar de usar milhares de GPUs no treinamento do MAI-1-preview, a Microsoft destaca que o MAI-Voice-1 pode rodar em apenas uma GPU na fase de inferência, algo raro em modelos de áudio avançados. Essa eficiência abre espaço para levar síntese de voz de alta qualidade a dispositivos locais, como PCs e consoles, sem depender integralmente da nuvem.

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *