O que o GPT-4o da OpenAI pode fazer?

A OpenAI revelou na segunda-feira seu mais recente modelo chamado GPT-4o (“o” para “omni”), e aparentemente é o mais próximo que chegamos de ter um assistente inteligente como “Jarvis” no filme Homem de Ferro.

O ponto forte é que o ChatGPT-4o pode lidar com diferentes modalidades, o que a maioria dos modelos de IA existentes não consegue fazer. Isso significa que o GPT-4o pode aceitar e gerar qualquer combinação de solicitações de texto, áudio e imagem.

A demo apresentada pela equipe no X (antigo Twitter) foi tão impressionante que muita gente a elogiou. Um ótimo recurso é que o GPT-4o responde às entradas de áudio em apenas 232 milissegundos, o que é semelhante ao tempo de resposta humana durante uma conversa.

“Parece inteligência artificial de cinema; e ainda é um pouco surpreendente para mim que seja real”, escreveu o CEO da OpenAI, Sam Altman, em uma postagem no blog na segunda-feira. “Alcançar tempos de resposta e expressividade em nível humano acaba sendo uma grande mudança no jogo”.

OpenAI começou a trazer os recursos de texto e imagem do GPT-4o aos usuários. Nas próximas semanas, os recursos de áudio e vídeo serão liberados para “um pequeno grupo de parceiros confiáveis ​​na API”, disse a empresa.

No entanto, aqui estão algumas coisas que você pode fazer com o modelo ChatGPT-4o.

Coisas que você pode fazer com GPT-4o

Crie imagens com texto legível

Até agora, alguns geradores de imagens de IA como o Midjourney ainda lutam para criar imagens com textos legíveis. OpenAI disse que o GPT-4o agora entende as descrições de texto muito melhor e pode tornar os textos das imagens legíveis.

Fonte da imagem: OpenAI

Tradução em tempo real

Numa situação em que é necessário um tradutor, o GPT-4o pode atuar como tal. Em uma demonstração em vídeo, a equipe da OpenAI demonstrou que o GPT-4o pode repetir algo dito em inglês para o espanhol, talvez outros idiomas, e vice-versa, do espanhol para o inglês.

Olhe e conte

Para pessoas com deficiência visual, ou apenas por diversão, o ChatGPT-4o pode observar e contar o que está acontecendo ao seu redor através da câmera do seu telefone. Em um caso, a modelo conseguiu contar a alguém que estava comemorando aniversário quando notou um bolo e uma vela no quarto.

Resolver problemas de matemática

O GPT-4o também pode analisar problemas matemáticos em uma folha de papel ou em uma tela e fornecer a resposta. Além disso, ele também pode orientar e orientar você para aprender como resolver o problema.

Inteligência artificial em reuniões visuais

O GPT-4o pode participar de reuniões visuais e organizar conservações com os participantes. Também pode ajudar os usuários a se prepararem para reuniões de entrevistas de emprego.