O ser humano adora dividir a História, ou qualquer história, em capítulos, ou fases. É natural e nos ajuda a entender melhor a evolução do objeto em estudo. Pode ser a história do planeta, dividida em eras geológicas. Pode ser a história da vida na Terra, dividida ao longo da evolução das espécies. Pode ser a história de um país, desde a sua fundação até os dias de hoje, dividida por governos.
Na tecnologia não é diferente. Aliás, talvez seja até mais necessária uma divisão por capítulos, diante do dinamismo e da constante aparição de novidades que botam abaixo tudo o que existia antes. Numeramos as gerações das redes de telefonia celular: 1G, 2G, 3G, 4G, 5G. Fizemos o mesmo com a Web. No começa era só Internet. Depois tiveram que nomear um novo estágio como Web 2.0, caracterizada pelas plataformas de conteúdo produzido pelo usuário. E agora vislumbra-se uma nova etapa, a Web 3.0.
Como jornalista de tecnologia que acompanha há sete anos o mercado de chatbots, além de organizador de um evento dedicado ao tema (Super Bots Experience) e autor de um relatório anual sobre esse ecossistema (Mapa do Ecossistema Brasileiro de Bots), não consigo me furtar de analisar a história dos robôs de conversação. Enxergo três gerações de chatbots, que descrevo a seguir.
Primeira geração: robôs construídos com árvores de decisão, sem um motor de processamento de linguagem natural (PLN). Neles, as conversas são guiadas: o robô oferece opções para o interlocutor humano na forma de botões ou de lista numerada, como se fosse uma URA por escrito. Em geral são robôs informacionais.
Segunda geração: robôs desenvolvidos com um motor de PLN. Neste caso, a conversa é aberta. O interlocutor humano pode escrever o que quiser e o motor tenta captar qual é a sua intenção, com base em uma curadoria prévia. A estrutura da resposta para cada intenção identificada é estabelecida previamente e pode incluir conteúdo buscado em outros sistemas da empresa (ex.: verificação do valor da última fatura, emissão de segunda via etc). Podem ser robôs informacionais e transacionais.
Terceira geração: robôs com inteligência artificial generativa. Construídos com um LLM (Large Language Model), eles são capazes de criar as respostas em tempo real e de manter longas conversas sem esquecer do seu histórico, ou seja, sem esquecer o que acabaram de falar. O ChatGPT é o exemplo mais emblemático de chatbot de terceira geração.
Tal como na história de outras tecnologias, a chegada de uma nova fase não implica no desaparecimento automático das anteriores. Robôs das três gerações vão conviver por muito tempo ainda. Aliás, para determinadas aplicações, continuará sendo melhor trabalhar com a primeira ou a segunda geração, seja pela facilidade e agilidade de implementação, seja pelo custo mais baixo, ou seja pelo maior controle sobre o robô.
Outro caminho bastante provável é que surjam robôs híbridos, que combinem características das três gerações, dependendo do canal, do contexto, ou da solicitação do cliente.
E o que virá depois disso? Difícil prever quando ou como será a quarta geração de chatbots. Mas imagino que a combinação de LLM e computação quântica, por exemplo, poderá trazer novidades interessantes. Como não tenho bola de cristal, prefiro me ater à análise do passado e do presente, fazendo as vezes de historiador.