A OpenAI desenvolveu o GPT-4, um modelo de linguagem natural avançado que promete revolucionar a maneira como as pessoas interagem com a tecnologia. O GPT-4 pode entender e gerar respostas para textos e imagens, e em testes acadêmicos e profissionais, ele teve um desempenho comparável ao de um humano.
No entanto, apesar dessas habilidades, ainda há preocupações sobre sua confiabilidade e segurança, e a equipe da OpenAI tem trabalhado para resolver essas questões.
A OpenAI reconstruiu toda a sua pilha de aprendizagem profunda e co-projetou um supercomputador com a Azure para sua carga de trabalho. Há um ano, treinaram o GPT-3.5 como um primeiro “teste” do sistema, encontrando e corrigindo bugs, e melhorando os fundamentos teóricos. Como resultado desse treinamento, o GPT-4 se tornou o primeiro grande modelo cujo desempenho foi previsto com alta precisão pela OpenAI.
O GPT-4 é uma conquista tecnológica emocionante, com o potencial de impactar vários setores. Mas, mesmo que você não seja um especialista em tecnologia, é importante entender os limites e possíveis riscos do modelo. Neste post, exploraremos o que torna o GPT-4 diferente de outros modelos de linguagem e como ele pode ser usado.
Como o GPT-4 funciona?
Para treinar o GPT-4, a equipe da OpenAI usou uma abordagem chamada de aprendizado profundo (ou Deep Learning), que se baseia em muitos dados e muita capacidade de processamento. O GPT-4 foi treinado por supercomputadores, que permitiram que o modelo aprendesse a prever a próxima palavra ou frase, com base no contexto fornecido.
Além disso, o GPT-4 também aprende com a orientação de especialistas humanos, em um processo chamado de Aprendizado por Reforço (ou Reinforcement Learning) a partir do Feedback Humano (RLHF), que ajuda a melhorar a precisão e a eficácia do modelo. De maneira resumida, o GPT-4 é um modelo de linguagem natural avançado que aprende com muitos dados e ajuda de especialistas de diferentes áreas, possibilitando que ele gere respostas precisas e seguras.
Quais são as novas features do GPT-4? O que mudou?
O GPT-4 apresenta algumas novas funcionalidades e melhorias em relação ao GPT-3, mas em uma conversa casual entre usuário e modelo, a distinção entre GPT-3.5 e GPT-4 pode ser sutil.
Poder de raciocínio
A primeira delas é que o GPT-4 é capaz de lidar com tarefas mais complexas, sendo mais confiável e criativo do que seu antecessor. Para ilustrar essa diferença, podemos comparar a capacidade de resolução de problemas entre o GPT-3 e o GPT-4.
Por exemplo, podemos pedir que ambos os modelos resolvam um problema mais complexo e verificar qual dos dois oferece uma resposta mais precisa e coerente. Para fazer esse teste, usarei o seguinte prompt:
“Você é um estudante universitário que precisa se preparar para uma prova importante que acontecerá daqui a 10 dias. Você tem 5 matérias diferentes para estudar e precisa dedicar, no mínimo, 3 horas para cada uma delas. Você trabalha meio período, de segunda a sexta-feira, das 8h às 12h, e tem duas atividades extracurriculares que ocupam 1 hora por dia, de segunda a quinta-feira, das 18h às 19h.
Você precisa dormir 7 horas por noite e tem um compromisso inadiável no final de semana, no qual ficará ausente por 8 horas. Como você pode criar um cronograma de estudo eficiente que lhe permita cobrir todo o material necessário e garantir que esteja bem preparado para a prova? Considere fatores como priorização de tarefas, tempo disponível e estratégias de estudo eficazes.”
Resposta GPT-3
Resposta GPT-4
As respostas do GPT-3 e GPT-4 para a pergunta sobre a criação de um cronograma de estudos eficiente são consideravelmente diferentes. O GPT-3 forneceu um cronograma detalhado de estudo, dividido em sessões diárias, enquanto o GPT-4 forneceu uma série de etapas gerais a serem seguidas, como dividir o tempo de estudo pelas matérias, identificar horários disponíveis e priorizar as matérias. Além disso, o GPT-4 ofereceu orientações sobre técnicas eficazes de estudo e cuidados pessoais, como sono adequado e alimentação saudável. Enquanto o GPT-3 forneceu um cronograma mais detalhado, o GPT-4 enfatizou mais a importância da organização geral e técnicas de estudo eficazes, fornecendo dicas mais amplas que podem ser aplicadas a diferentes situações de estudo.
Aceita imagens como input
Além disso, o GPT-4 é capaz de receber imagens como entradas, o que significa que ele pode entender e raciocinar a partir delas de maneira mais sofisticada. A OpenAI tem trabalhado em parceria com a Be My Eyes. Essa nova capacidade do GPT-4 tem o potencial de impactar diversas áreas como a medicina, que o modelo pode analisar imagens médicas para auxiliar no diagnóstico.
No relatório técnico do GPT-4, podemos ver como ele consegue raciocinar a partir de imagens:
“Este meme é uma piada que combina duas coisas não relacionadas: imagens da Terra vista do espaço e nuggets de frango.
O texto do meme sugere que a imagem abaixo é uma bela imagem da Terra vista do espaço. No entanto, a imagem é na verdade nuggets de frango dispostos para se assemelhar vagamente a um mapa do mundo.
O humor desse meme vem da inesperada justaposição do texto e da imagem. O texto cria uma expectativa de uma imagem majestosa da terra, mas a imagem é na verdade algo mundano e bobo.”
Melhoria em idiomas
Uma grande evolução do GPT-4 em relação ao GPT-3 é sua habilidade em lidar com múltiplos idiomas. Durante os testes realizados, o GPT-4 demonstrou desempenho superior ao GPT-3 em 24 dos 26 idiomas testados, incluindo línguas menos comuns, como letão, galês e suaíli.
Aceita links de forma “embedada”
Agora o GPT-4 é capaz de lidar com mais de 25.000 palavras de texto, permitindo casos de uso como criação de conteúdo extenso, conversas prolongadas e análise e pesquisa de documentos. Para isso, podemos utilizar URLs como referência para fazer alguma pergunta específica.
Segurança
Por fim, a equipe da OpenAI também melhorou a segurança do GPT-4. De acordo com a empresa, o modelo agora é mais seguro e orientado para o consumidor final, e recebeu treinamento com técnicas que visam aprimorar a segurança. Essas melhorias foram implementadas para garantir que o GPT-4 não gere respostas inadequadas ou maliciosas, tornando-o um modelo mais confiável e seguro para uso em diversas áreas.
Limitações e desafios
Com o GPT-4, é possível criar textos longos, ter conversas mais complexas e analisar documentos com mais eficiência. Porém, mesmo com suas capacidades incríveis, é importante lembrar que ele ainda tem limitações e desafios.
Uma das maiores limitações do GPT-4 é sua falta de confiabilidade completa. Mesmo sendo uma grande melhoria em relação aos modelos anteriores, ainda não é totalmente confiável e pode gerar informações imprecisas ou cometer erros de raciocínio. Portanto, é crucial ter muito cuidado ao usar as saídas do modelo de linguagem, especialmente em contextos de alto risco, para garantir que o protocolo exato (como revisão humana) seja seguido seguindo as necessidades de cada caso de uso específico.
O GPT-4 pontua 40% mais alto do que o GPT-3.5 em avaliações internas de factualidade.
O GPT-4, assim como seus antecessores, pode apresentar alguns riscos, como gerar conselhos prejudiciais, bugs no código ou informações imprecisas. No entanto, a OpenAI contratou mais de 50 especialistas de diversas áreas, como segurança cibernética, confiança e segurança internacional, para testar adversamente o modelo e entender a extensão desses riscos. Com base no feedback e dados desses especialistas, a OpenAI implementou melhorias e mitigações para o modelo, como a capacidade de recusar solicitações sobre como sintetizar produtos químicos perigosos.
Como eu posso usar o GPT-4?
Se você já é assinante do ChatGPT Plus, pode usar o GPT-4 com algumas limitações. Porém, para acessar a API do ChatCompletion utilizando o GPT-4, você precisa se inscrever na lista de espera da OpenAI. É importante lembrar que a entrada de imagem ainda está limitada.
O preço é de US$0,03 por 1k tokens de prompt e US$0,06 por 1k tokens de “completion”. Os limites são de 40 mil tokens por minuto ou 200 solicitações por minuto. O GPT-4 tem uma limitação de prompt de 8.192 tokens, e está sendo fornecido acesso limitado à versão de 32.768 tokens, o GPT-4-32k. O preço é de US$0,06 por 1k tokens de prompt e US$0,12 por 1k tokens de “completion”.
Conclusão
O GPT-4 apresenta uma melhoria em relação ao ChatGPT, mas é importante ter expectativas realistas. Ambos os modelos são baseados na mesma arquitetura e treinados com técnicas semelhantes, como o Reinforcement Learning a partir do Feedback Humano (RLHF). No entanto, o GPT-4 também foi treinado com técnicas para melhorar sua segurança.
Em termos de capacidades, ChatGPT e GPT-4 são bastante semelhantes, embora o GPT-4 aceite entradas de imagens e texto. No desempenho, o GPT-4 supera o ChatGPT, em relação à segurança e precisão. Apesar disso, ambos ainda enfrentam limitações e riscos, como produzir conteúdo incorreto.
Em resumo, o GPT-4 é uma versão aprimorada do ChatGPT que aceita imagens e texto, e é mais seguro, preciso e criativo. A corrida para criar modelos de linguagem avançados está acelerada, e é fundamental se manter informado sobre os progressos, riscos e limitações desses modelos enquanto navegamos neste cenário em rápida evolução.