quinta-feira, 4 de fevereiro de 2021

O que é Machine Learning?

Arthur Samuel, um pioneiro no campo da inteligência artificial e jogos de computador, cunhou o termo “Aprendizado de Máquina” . Ele definiu o aprendizado de máquina como - “Campo de estudo que dá aos computadores a capacidade de aprender sem serem programados explicitamente”.

De uma maneira muito leiga, o Aprendizado de Máquina (AM) pode ser explicado como automatizando e melhorando o processo de aprendizagem de computadores com base em suas experiências sem serem realmente programados, ou seja, sem qualquer assistência humana. O processo começa alimentando dados de boa qualidade e, em seguida, treinando nossas máquinas (computadores), construindo modelos de aprendizado de máquina usando os dados e diferentes algoritmos. A escolha dos algoritmos depende de que tipo de dados temos e que tipo de tarefa estamos tentando automatizar.

Exemplo: Treinamento de alunos durante o exame.

Enquanto se preparam para os exames, os alunos não estudam o assunto, mas tentam aprendê-lo com total compreensão. Antes do exame, eles alimentam sua máquina (cérebro) com uma boa quantidade de dados de alta qualidade (perguntas e respostas de diferentes livros ou anotações do professor ou vídeo-aulas online). Na verdade, eles estão treinando seu cérebro tanto com entradas quanto com saídas, isto é, que tipo de abordagem ou lógica eles têm para resolver um tipo diferente de questões. Cada vez que resolvem os papéis dos testes práticos e encontram o desempenho (precisão / pontuação), comparando as respostas com a chave dada, Gradualmente, o desempenho vai aumentando, ganhando mais confiança com a abordagem adotada. É assim que os modelos são construídos,treinar a máquina com dados (entradas e saídas são fornecidas ao modelo) e, quando chegar a hora, teste os dados (apenas com entrada) e obtenha as pontuações do modelo comparando sua resposta com a saída real que não foi alimentada durante o treinamento. Os pesquisadores estão trabalhando com esforços assíduos para melhorar algoritmos e técnicas para que esses modelos tenham um desempenho ainda melhor.

Diferença básica em ML e programação tradicional?

  • Programação tradicional: Nós alimentamos DADOS (entrada) + PROGRAMA (lógica), rodamos na máquina e obtemos a saída.
  • Aprendizado de Máquina: Alimentamos DADOS (Entrada) + Saída, executamos na máquina durante o treinamento e a máquina cria seu próprio programa (lógica), que pode ser avaliado durante o teste.

O que exatamente aprender significa para um computador?

Diz-se que um computador está aprendendo com as Experiências com relação a alguma classe de Tarefas , se seu desempenho em uma dada Tarefa melhora com a Experiência.

A computer program is said to learn from experience E with respect to some class of tasks T and performance measure P, if its performance at tasks in T, as measured by P, improves with experience E.

Exemplo: jogar damas.

E = a experiência de jogar muitos jogos de damas.

T = a tarefa de jogar damas.

P = a probabilidade de o programa vencer o próximo jogo.

Em geral, qualquer problema de aprendizado de máquina pode ser atribuído a uma das duas classificações gerais:
Aprendizagem supervisionada e Aprendizagem não supervisionada.

Como as coisas funcionam na realidade:

  • Falando em compras online, existem milhões de usuários com uma gama ilimitada de interesses em relação a marcas, cores, faixa de preço e muito mais. Ao fazer compras online, os compradores tendem a pesquisar vários produtos. Agora, pesquisar um produto com frequência fará com que o comprador, as páginas da web, o mecanismo de pesquisa ou a loja online do comprador comece a recomendar ou mostrar ofertas para aquele produto específico. Não há ninguém sentado lá para codificar tal tarefa para cada usuário, toda essa tarefa é totalmente automática. Aqui, o ML desempenha seu papel. Pesquisadores, cientistas de dados, aprendizes de máquina constroem modelos na máquina usando boa qualidade e uma grande quantidade de dados e agora sua máquina está executando e até mesmo melhorando automaticamente com mais e mais experiência e tempo.
    Tradicionalmente, a propaganda era feita apenas em jornais, revistas e rádio, mas agora a tecnologia nos tornou inteligentes o suficiente para fazer propaganda direcionada (sistema de anúncios online), que é um método mais eficiente para atingir o público mais receptivo.
  • Mesmo na área da saúde, o ML está fazendo um trabalho fabuloso. Pesquisadores e cientistas prepararam modelos para treinar máquinas para detectar câncer apenas olhando para imagens de células deslizantes. Para os humanos realizarem essa tarefa, demoraria muito tempo. Mas agora, sem mais demora, as máquinas predizem as chances de ter ou não câncer com alguma precisão e os médicos só precisam dar uma chamada de garantia, é isso. A resposta para - como isso é possível é muito simples - tudo o que é necessário, é, máquina de alta computação, uma grande quantidade de dados de imagem de boa qualidade, modelo de ML com bons algoritmos para obter resultados de última geração.
    Os médicos estão usando ML até mesmo para diagnosticar pacientes com base em diferentes parâmetros em consideração.
  • Todos vocês podem ter usado classificações IMDB, Google Fotos, onde reconhece rostos, Google Lens, onde o modelo de reconhecimento de imagem de texto ML pode extrair texto das imagens que você alimenta, Gmail que usa categorias de e-mail como social, promoção, atualizações ou fórum classificação de texto, que faz parte do ML.

Como funciona o ML?

  • Coletar dados anteriores em qualquer forma adequada para processamento. Quanto melhor a qualidade dos dados, mais adequados serão para modelagem
  • Processamento de dados - às vezes, os dados coletados estão na forma bruta e precisam ser pré-processados.
    Exemplo: Algumas tuplas podem ter valores ausentes para determinados atributos, e, neste caso, deve ser preenchido com valores adequados para realizar o aprendizado de máquina ou qualquer forma de mineração de dados.
    Valores ausentes para atributos numéricos, como o preço da casa, podem ser substituídos pelo valor médio do atributo, enquanto valores ausentes para atributos categóricos podem ser substituídos pelo atributo com o modo mais alto. Isso invariavelmente depende dos tipos de filtros que usamos. Se os dados estiverem na forma de texto ou imagens, será necessário convertê-los para a forma numérica, seja uma lista ou array ou matriz. Simplesmente, os dados devem ser relevantes e consistentes. Deve ser convertido em um formato compreensível pela máquina
  • Divida os dados de entrada em conjuntos de treinamento, validação cruzada e teste. A proporção entre os respectivos conjuntos deve ser 6: 2: 2
  • Construir modelos com algoritmos e técnicas adequados no conjunto de treinamento.
  • Testar nosso modelo conceituado com dados que não foram fornecidos ao modelo no momento do treinamento e avaliar seu desempenho usando métricas como pontuação F1, precisão e recall.

Pré-requisitos para aprender ML

  • Álgebra Linear
  • Estatística e Probabilidade
  • Cálculo
  • Teoria dos grafos
  • Habilidades de programação - linguagem como Python, R, MATLAB, C ++ ou Octave

Artigo escrito por Mohit Gupta_OMG :) e traduzido por Acervo Lima de ML | What is Machine Learning?.

0 comentários:

Postar um comentário