Introducing G2.ai, the future of software buying.Try now

Modelos Generativos vs. Discriminativos: Decodificando o Aprendizado Profundo

20 de Dezembro de 2024
por Holly Landis

Com o aumento do aprendizado profundo, novos algoritmos como modelos generativos e discriminativos se tornaram o assunto do mercado. Enquanto modelos generativos e discriminativos estão sendo integrados a vários domínios de aplicação, o valor matemático latente dessas técnicas de aprendizado de máquina pode transformar drasticamente o ciclo de vida de geração de produtos. Como especialista em aprendizado de máquina, as principais anomalias de raiz estão relacionadas à gestão de banco de dados incompatível, armazenamento insuficiente e rotulagem incorreta, levando a falhas e erros.

Explorar modelos generativos e discriminativos e entender suas aplicações na tecnologia de aprendizado profundo construiria uma curva de aprendizado e ajudaria você a tomar uma decisão informada sobre qual escolher para seus dados privados e sensíveis. Avaliar essas opções dentro de software de rotulagem de dados pode ser uma maneira rápida de gerenciar grandes volumes, otimizar o armazenamento e construir processos robustos de modelagem preditiva.

Vamos aprender sobre essas duas técnicas predominantes de aprendizado de máquina e explorar as nuances de ambas.

À medida que a IA generativa avança ainda mais, novas formas de previsões de dados estão em plena experimentação em várias indústrias. Modelos generativos e discriminativos estão em uma liga própria, mas seguem diferentes métodos de manipulação e análise de dados para prever resultados.

Como funcionam os modelos generativos e discriminativos

Quando algoritmos recebem grandes quantidades de dados para treinar um modelo generativo, ele é usado para ajudar o algoritmo a identificar estruturas e padrões que ajudarão a criar novas saídas. O modelo generativo aprende a distribuição de probabilidade desses padrões e, em seguida, faz novas saídas que se assemelham ao conjunto de dados original. Mesmo que os dados não sejam rotulados, os modelos generativos ainda podem distinguir os padrões nos dados e criar saídas semelhantes.

Para modelos discriminativos, dados não rotulados são um desafio muito maior. Modelos discriminativos precisam de rótulos para entender onde estão os limites entre tipos de dados, classes ou categorias. Por exemplo, uma imagem mostrando um cachorro, um gato, uma bola e uma árvore precisa ter rótulos em cada um desses elementos para que o modelo distinga os limites desses objetos. Esses modelos são mais fáceis de criar do que modelos generativos porque podem funcionar efetivamente com menores quantidades de dados de treinamento e rotulagem de limites simples.

Fórmula para modelo generativo

O modelo generativo foca em aprender com o comportamento passado do modelo e reaproveitar isso para prever novas categorias para novos pontos de dados. Principalmente usado em aprendizado não supervisionado, é muito vital para análise de sentimentos, detecção de anomalias, detecção de spam e redução de ruído.

Fórmula para modelo generativo:

P (X,Y) = P(Y) x P(X | Y)


P (Y) → Distribuição de dados passados sobre rótulos.

P (X | Y) → Verossimilhança dos dados X dado o rótulo Y

Fórmula para modelo discriminativo

O modelo discriminativo foca apenas nos limites de decisão para atribuir rótulos rapidamente aos conjuntos de dados usando uma técnica de "fissão". No entanto, o modelo discriminativo às vezes precisa ser verificado novamente para "classificação incorreta"

Fórmula para modelo discriminativo:

Objetivo: Modelar diretamente a probabilidade P (Y | X) focando nos limites de decisão e não na distribuição de dados.

P (Y | X; θ) = exp (f( X, Y, θ)) / Σ y' exp (X, Y'; θ)

 

Aqui,

θ → Parâmetros do modelo

f (X, Y, θ) : Uma função de pontuação indicando quão bem (X,Y) se ajusta ao modelo

Como é evidente pela fórmula, o modelo generativo usa a distribuição de dados binomial para derivar contexto e padrões dentro dos próprios dados, enquanto o modelo discriminativo calcula a probabilidade de classe rapidamente com mapeamento mental e classificação passada.

Quer aprender mais sobre Software de Rotulagem de Dados? Explore os produtos de Rotulagem de Dados.

Tipos de modelo generativo

Se você está procurando criar uma nova saída inteiramente ou analisar dados existentes, determina qual tipo de modelo você usa.

Modelos generativos são mais adequados para aplicações que requerem uma nova saída. Os exemplos mais comuns são descritos aqui.

  • Redes Bayesianas, também conhecidas como Rede de Bayes, usam gráficos acíclicos direcionados (DAG) para calcular probabilidades ou detectar anomalias nos dados. Elas fazem inferências bayesianas, um tipo de previsão estatística que atualiza a probabilidade de uma hipótese à medida que mais informações se tornam disponíveis. À medida que o modelo generativo cria novas saídas com base nos dados de treinamento, esses novos dados são então alimentados de volta no algoritmo para continuar avaliando padrões. Isso permite que o modelo crie probabilidades mais prováveis à medida que mais dados são revisados.
  • Modelos generativos de autorregressão são usados principalmente para modelagem de séries temporais, onde correlações entre comportamentos passados nos dados são usadas para prever comportamento futuro. A autorregressão é particularmente útil em várias indústrias, com aplicações como previsões de vendas ou estratégias de investimento.
  • Redes adversárias generativas (GANs) usam tanto modelagem generativa quanto discriminativa como parte do modelo generativo mais amplo. O gerador inicialmente treina e produz novos pontos de dados ao longo do tempo. Essas saídas são então alimentadas no submodelo discriminativo para classificar quais partes dos dados gerados são reais ou falsas.
  • Naive Bayes: Naive Bayes é um método probabilístico simples que classifica novos dados de entrada comparando suas características ou atributos independentes à distribuição de probabilidade anterior. É inteiramente baseado no "teorema de Bayes" e é um método popular para classificar conjuntos de dados menores.
  • Campo Aleatório de Markov: Campo aleatório de Markov representa a probabilidade conjunta de variáveis usando gráficos técnicos onde variáveis são nós e arestas podem indicar as dependências dentro dos dados. É um algoritmo comum usado para processamento de linguagem natural e modelagem de linguagem em larga escala.
  • Modelo oculto de Markov: Um modelo oculto de Markov é um algoritmo estatístico para interpretar e classificar dados sequenciais onde a saída depende de estados ocultos. Ele captura a classe correta via estado oculto e função de ativação que determina a classe correta.
  • Alocação de Dirichlet Latente: Este modelo generativo é usado para modelagem de tópicos. Ele assume documentos como uma mistura de tópicos, gera probabilidades para diferentes tópicos e atribui probabilidades a cada tópico antes de atribuí-lo a uma categoria específica.

Tipos de modelo discriminativo

Modelos discriminativos são mais apropriados para analisar dados existentes do que criar uma nova saída. Eles usam essas informações para determinar limites entre categorias ou objetos em textos e imagens. Isso permite que os usuários identifiquem tanto padrões quanto anomalias em grandes conjuntos de dados.

Por exemplo, informações inseridas em um modelo discriminativo podem separar dados de notas de faculdade em categorias de Aprovação ou Reprovação com base na rotulagem de dados anterior. Os tipos mais comuns são definidos aqui.

  • Regressão logística é um modelo linear simples usado para classificação binária entre dois grupos distintos nos dados. Os valores dos dados de entrada devem resultar em uma saída entre 0 e 1. Por exemplo, bancos poderiam usar regressão logística para prever se uma transação com cartão foi genuína (0) ou fraude (1) – há apenas dois resultados possíveis na análise de dados, e nada novo está sendo criado. O modelo está simplesmente avaliando relações entre os pontos de dados de entrada.
  • Árvores de decisão também são usadas para trabalho de classificação. Esses modelos usam uma estrutura "se isso, então aquilo" para criar ramificações de possíveis resultados com base em certas escolhas. A árvore divide progressivamente os dados em grupos menores e menores com base nos atributos de cada ponto de dados individual. A árvore continua a se ramificar, com menos peças de dados em cada ramificação à medida que a árvore avança até que os dados não possam mais ser divididos.
  • Máquinas de vetores de suporte (SVM) podem ser aplicadas tanto para trabalho de classificação quanto de regressão. Os limites de dois pontos de dados criam um espaço vazio entre eles conhecido como vetor de suporte ou margem. Isso é como uma zona de amortecimento entre dois objetos ou pontos de dados, então quanto maior a margem, melhor o modelo é em identificar esses como duas classes separadas. SVMs têm inúmeras aplicações, desde software de reconhecimento facial até análise de sentimentos.
  • Redes neurais (para classificação): Redes neurais processam principalmente texto sequencial armazenando a entrada em um estado oculto e acionando o nó de saída correto no próximo estado de acordo com a entrada anterior. O tipo mais popular de rede neural é a rede neural artificial (ANN), RNNs e CNNs.

Modelos discriminativos são amplamente usados para classificação de imagens e detecção de objetos em aprendizado de máquina, pois usam redes neurais em larga escala que imitam a compreensão humana para identificar as qualidades de uma imagem. Eles também podem ser usados para tarefas de processamento de linguagem natural (NLP) como análise de sentimentos e revisões de tradução multilíngue.

Algoritmos adicionais de modelo discriminativo

  • K vizinho mais próximo: K vizinho mais próximo é uma técnica supervisionada onde a classe de um ponto de dados é calculada com base no limite de decisão de "K" pontos de dados que estão próximos a ele. A classe de "K" pontos tem um alto potencial e é atribuída a ele.
  • Campo aleatório condicional: Campos aleatórios condicionais são modelos discriminativos para tarefas de previsão estruturada. Ele cria um gráfico não direcionado para capturar dependências, correlacionar características e gerar rótulos para sequências.
  • Floresta aleatória: O algoritmo de floresta aleatória agrupa várias árvores de decisão para treinar o algoritmo em todos os possíveis intervalos de entrada e gerar saída para grandes conjuntos de dados ou clusters de imagens.

Indústrias que usam modelos generativos

Com modelos generativos criando novas saídas, indústrias que já possuem uma grande quantidade de dados podem usá-los de várias maneiras para tornar seu trabalho mais produtivo e eficiente.

Saúde

O campo médico precisa superar inúmeros desafios para salvar vidas de pacientes. Ferramentas de inteligência artificial (IA) preditiva e generativa ajudam profissionais médicos a relatar imagens, descobrir novos medicamentos por meio de pesquisa sintetizada e personalizar o tratamento para pacientes com base em suas necessidades e histórico médico.

Modelos generativos também podem dar aos médicos e farmacêuticos mais tempo em seu dia simplificando e automatizando tarefas como transcrever notas de pacientes e resumir informações de pacientes para revisão.

Marketing

No mundo da publicidade, os profissionais de marketing usam modelos generativos para criar campanhas que alcançam novos mercados. Tarefas como escrever descrições de produtos ou criar tags de imagem otimizadas para mecanismos de busca (SEO) consomem tempo significativo, mas ferramentas de IA generativa podem acelerar esse processo e deixar as equipes capazes de gastar mais tempo no desenvolvimento de estratégias. Modelos de IA também podem criar recomendações personalizadas para clientes com base nos dados sobre suas experiências anteriores.

Manufatura

Engenheiros e fabricantes podem acelerar seu processo de design usando ferramentas de IA generativa para criar novas ideias que se encaixem nas restrições de um projeto e correspondam a projetos semelhantes concluídos no passado.

Modelos generativos também podem ser usados para rastrear necessidades de manutenção contínua de equipamentos com base em dados históricos e alertar as equipes sobre possíveis problemas antes que uma máquina apresente falhas.

Mídia

Novas mídias, como conteúdo visual e de áudio, podem ser produzidas usando ferramentas generativas. Empresas de esportes ou eventos ao vivo podem facilmente fazer resumos de destaques com IA generativa para fornecer informações aos fãs mais rapidamente do que quando humanos fazem o trabalho sozinhos.

Para veículos de notícias e publicações online que gerenciam milhares de peças de dados e conteúdo, a IA generativa pode facilitar muito a localização e atualização de arquivos existentes.

Indústrias que usam modelos discriminativos

Embora modelos discriminativos não criem novos dados por si mesmos, eles ainda têm muitos usos. Muitas indústrias se beneficiam dessas ferramentas para melhorar a tomada de decisões da empresa e aprimorar seu desempenho nos negócios.

Varejo e comércio eletrônico

Quando você é um vendedor, precisa entender as tendências do mercado e o impacto potencial que elas têm nas vendas futuras, seja online ou em uma loja física. Usando modelos discriminativos, os proprietários de empresas podem pegar dados históricos anteriores e fazer previsões mais precisas sobre como será a receita.

Modelos discriminativos simplificam decisões proativas que afetam o resultado final do seu negócio. Você pode otimizar melhor suas estratégias de produto, como prever sazonalidade e popularidade de produtos, além de obter uma melhor compreensão do comportamento do cliente.

Publicidade e marketing

Vender produtos e serviços requer um entendimento de como os clientes pensam e se comportam. Usando dados existentes em um modelo discriminativo, os profissionais de marketing podem segmentar clientes com base em padrões em seu comportamento e criar campanhas direcionadas em torno dessa segmentação.

Por exemplo, clientes que se encaixam na categoria de pais poderiam receber marketing direcionado para vendas de volta às aulas, aumentando a probabilidade de que façam uma compra porque a publicidade fala às suas circunstâncias.

Finanças

Embora as finanças ainda sejam vistas como uma indústria antiquada, seu funcionamento interno está mudando rapidamente para acompanhar a tecnologia, incluindo o uso de modelos de IA discriminativos. Os financistas tornaram a modelagem preditiva popular, principalmente quando se concentra em fazer previsões sobre ações ou taxas de juros usando dados passados e relatórios econômicos.

Profissionais financeiros também dependem de análise preditiva para examinar dados de tradução para encontrar anomalias que podem indicar atividade fraudulenta ou determinar níveis de risco.

Veículos e máquinas autônomas

A modelagem discriminativa é particularmente útil em veículos autônomos, pois pode identificar limites de objetos na classificação e rotulagem de imagens. Entender objetos no mundo real, em tempo real, mantém passageiros e pedestres seguros e permite que veículos autônomos mapeiem com precisão o mundo ao seu redor com modelagem preditiva baseada em imagens.

Modelo generativo vs. discriminativo: benefícios e desafios

A IA generativa ainda está em sua infância, então os usuários não devem esperar muito dessas ferramentas inicialmente. Se a precisão for uma prioridade, modelos discriminativos serão mais adequados para você. Mas outros tipos de modelos de IA vêm com desafios significativos.

Precisão e confiabilidade

A novidade dos modelos generativos significa que eles frequentemente criam dados imprecisos quando existem problemas no conjunto de dados. Nunca devemos confiar totalmente nessas ferramentas devido ao potencial de imprecisão que dados não rotulados e não supervisionados têm. Modelos discriminativos têm suas próprias falhas, mas são tipicamente mais confiáveis e precisos, pois usam apenas dados rotulados.

Privacidade

A privacidade na modelagem de IA pode ser um problema com ambos os tipos, mas especialmente para generativos. Se conteúdo privado ou sensível dentro de conjuntos de treinamento for usado para criar novas saídas, a segurança dos dados originais pode ser comprometida.

Viés e transparência

O viés apresenta um desafio especialmente difícil para a IA generativa. Sempre que conjuntos de treinamento têm viés ou falta de transparência sobre como o algoritmo foi construído, as saídas criadas por esses modelos herdarão os vieses implícitos dos dados nos quais foram treinados. Construir políticas para controlar isso o máximo possível é essencial ao criar um novo modelo generativo.

Primeiro rotule; depois qualifique

Enquanto modelos generativos oferecem funcionalidades para prever tendências comuns e classificar tokens futuros, modelos discriminativos categorizam dados de forma inteligente criando mapas mentais. Ambas essas técnicas estão sendo adotadas para processar conjuntos de dados sequenciais maiores e criar ondas em indústrias como marketing, saúde, bancos ou varejo. Esses algoritmos melhorarão em desempenho e podem ser implantados em setores industriais mais amplos para alcançar maiores graus de precisão.

Explore como redes neurais recorrentes são usadas para processar dados sequenciais e gerar respostas coerentes para consultas textuais.

Holly Landis
HL

Holly Landis

Holly Landis is a freelance writer for G2. She also specializes in being a digital marketing consultant, focusing in on-page SEO, copy, and content writing. She works with SMEs and creative businesses that want to be more intentional with their digital strategies and grow organically on channels they own. As a Brit now living in the USA, you'll usually find her drinking copious amounts of tea in her cherished Anne Boleyn mug while watching endless reruns of Parks and Rec.