Prepare-se para as provas
Obter pontos
Guias e Dicas

Prepare-se para as provas

Estude fácil! Tem muito documento disponível na Docsity

Ganhe pontos para baixar

Ganhe pontos ajudando outros esrudantes ou compre um plano Premium

Guias e Dicas

Venda na Docsity

Entrar Cadastre-se

Prepare-se para as provas

Estude fácil! Tem muito documento disponível na Docsity

Encontrar documentos

Prepare-se para as provas com trabalhos de outros alunos como você, aqui na Docsity

Pesquisar documentos Store

Os melhores documentos à venda: Trabalhos de alunos formados

Videoaulas

Prepare-se com as videoaulas e exercícios resolvidos criados a partir da grade da sua Universidade

Quiz

Responda perguntas de provas passadas e avalie sua preparação.

Pesquise entre todos os recursos de estudo

Docsity AINEW

Resuma seus documentos, faça perguntas, converta-os em questionários e mapas conceituais

TCC e ENEM 2025

Estude com provas passadas, TCCs e dicas úteis

Explorar perguntas

Tire suas dúvidas lendo as respostas dadas por outros alunos como você.

Ganhe pontos para baixar

Ganhe pontos ajudando outros esrudantes ou compre um plano Premium

Compartilhe documentos

20 Pontos

Por cada documento compartilhado

Responda às perguntas

5 Pontos

por cada resposta enviada (máx. 1 por dia)

Todas as maneiras de obter pontos grátis

Ganhe pontos imediatamente

Escolha um Plano Premium com todos os pontos que precisa

Oportunidades de estudo

Escolha seu próximo programa de estudos

Entre em contato direto com as melhores Universidades do mundo. Pesquise entre milhares de Universidades e parceiros oficiais

Comunidade

Pergunte à comunidade

Peça ajuda à comunidade e tire suas dúvidas relacionadas ao estudo

Ranking universidades

Descubra as melhores universidades em seu país de acordo com os usuários da Docsity

Guias grátis

Os eBooks que salvam estudantes!

Baixe gratuitamente nossos guias de estudo, métodos para diminuir a ansiedade, dicas de TCC preparadas pelos professores da Docsity

Do blog

Vá para o blog

Aprendizagem de Máquina - Conceitos e Definições, Manuais, Projetos, Pesquisas de Inteligência Artificial

Centro Universitário UNIDOM - BOSCO (UNIDOM - BOSCO)Inteligência Artificial

O aprendizado automático explora o estudo e construção de algoritmos que podem aprender de seus erros e fazer previsões sobre dados.

Tipologia: Manuais, Projetos, Pesquisas

2020

Compartilhado em 24/04/2020

Kleber2707 🇧🇷

1 documento

1 / 20

Esta página não é visível na pré-visualização

Não perca as partes importantes!

José Augusto Baranausk as

Departamentode Física e Matemática– FFCLRP-USP

augusto@usp.br

http://dfm.ffclr p.usp.br/~augusto

Aprendizado de Máquina

Conceitos e Definições

Os diversos sistemas de AM

possuem características

particulares e comuns que

possibilitam sua classificação

quanto à linguagem de descrição,

modo, paradigma e forma de

aprendizado utilizados

Algumas dessas características,

conceitos introdutórios e

definições são introduzidos nesta

aula, os quais são importantes

para a compreensão das aulas

subseqüentes

Conteúdo

Introdução

Hierarquia do Aprendizado

Paradigmas de Aprendizado

AM: Conceitos e Definições

Linguagens de Descrição

Aprendizado de Máquina (AM)

Aprendizado de Máquina é uma área de IA cujo

objetivo é o desenvolvimento de técnicas

computacionais sobre o aprendizado bem como a

construção de sistemas capazes de adquirir

conhecimento de forma automática

Um sistema de aprendizado é um programa de

computador que toma decisões baseado em

experiências acumuladas através da solução

bem sucedida de problemas anteriores

Motivação (1)

Dado um conjunto de objetos, colocar os

objetos em grupos baseados na

similaridade entre eles

Motivação (1)

Dado um conjunto de objetos, colocar os

objetos em grupos baseados na

similaridade entre eles

Com

Com bico

bico

Sem

Sem bico

bico

Motivação (1)

Dado um conjunto de objetos, colocar os

objetos em grupos baseados na

similaridade entre eles

Terra

Água

Documentos relacionados

Aprendizagem de Potênciação: Conceitos Básicos e Exercícios

Introdução à Gerência de Sistemas Operacionais: Definições, Conceitos e Funções

Conceitos Básicos Sobre Vibrações: Definições, Tipos e Riscos

Análise de dados e algoritmos de aprendizagem de máquina

Análise de Dados e Aprendizagem de Máquina: Algoritmos e Técnicas

Introdução à Inteligência Artificial e Aprendizado de Máquina: Conceitos Essenciais

conceitos e definições

EMPREENDEDORISMO: EVOLUÇÃO HISTÓRICA, DEFINIÇÕES E ABORDAGENS.*

(2)

Diagnóstico e Tipos de Transtornos da Aprendizagem: Definições e Características

Conceitos Básicos do Turismo no Brasil: Definições, Conceitos e Instituições

Conceitos e Definições de AIA

Definições e Conceitos em EAD

Pré-visualização parcial do texto

Baixe Aprendizagem de Máquina - Conceitos e Definições e outras Manuais, Projetos, Pesquisas em PDF para Inteligência Artificial, somente na Docsity!

José Augusto Baranauskas Departamento de Física e Matemática – FFCLRP-USP

augusto@usp.br http://dfm.ffclrp.usp.br/~augusto

Aprendizado de MáquinaAprendizado de Máquina

Conceitos e DefiniçõesConceitos e Definições

Os diversos sistemas de AM

possuem características

particulares e comuns que

possibilitam sua classificação

quanto à linguagem de descrição,

modo, paradigma e forma de

aprendizado utilizados

Algumas dessas características,

conceitos introdutórios e

definições são introduzidos nesta

aula, os quais são importantes

para a compreensão das aulas

subseqüentes

ConteúdoConteúdo

Introdução

Hierarquia do Aprendizado

Paradigmas de Aprendizado

AM: Conceitos e Definições

Linguagens de Descrição

Aprendizado de Máquina (AM) Aprendizado de Máquina (AM)

Aprendizado de Máquina é uma área de IA cujo

objetivo é o desenvolvimento de técnicas

computacionais sobre o aprendizado bem como a

construção de sistemas capazes de adquirir

conhecimento de forma automática

Um sistema de aprendizado é um programa de

computador que toma decisões baseado em

experiências acumuladas através da solução

bem sucedida de problemas anteriores

Motivação (1)Motivação (1)

Dado um conjunto de objetos, colocar os

objetos em grupos baseados na

similaridade entre eles

Motivação (1) Motivação (1)

Dado um conjunto de objetos, colocar os

objetos em grupos baseados na

similaridade entre eles

ComCom bicobico

Sem bicoSembico

Motivação (1)Motivação (1)

Dado um conjunto de objetos, colocar os

objetos em grupos baseados na

similaridade entre eles

ÁguaÁgua TerraTerra

Motivação (1) Motivação (1)

Dado um conjunto de objetos, colocar os

objetos em grupos baseados na

similaridade entre eles

OvíparoOvíparo

MamíferoMamífero

MotivaçãoMotivação (2)(2)

Dados pares (x,f(x)), inferir f(·)

4 16

3 9

2 4

1 1

x f(x) Dada uma amostra finita, é

freqüentemente impossível

determinar a verdadeira função f(·)

Abordagem: Encontre uma hipótese

( modelo ) nos exemplos de treinamento

e assuma que a hipótese se repita para

exemplos futuros também

f = função desconhecida

x (^1) x (^2) x (^3) x (^4)

y = f (x 1 , x 2 , x 3 , x 4 )

f : X 1 × X 2 × X 3 × X 4 → Y

Exemplo X 1 X 2 X 3 X 4 Y z 1 0 1 1 0 0 z 2 0 0 0 0 0 z 3 0 0 1 1 1 z 4 1 0 0 1 1 z 5 0 1 1 0 0 z 6 1 1 0 0 0 z 7 0 1 0 1 0

Motivação (2) Motivação(2)

Exemplo: Cogumelos Comestíveis xExemplo: Cogumelos Comestíveis x

VenenososVenenosos

Um pesquisador foi a

campo e coletou diversos

cogumelos

Ao chegar em seu

laboratório, ele mediu o

comprimento e altura de

cada cogumelo

Ele também classificou

cada cogumelo coletado

como comestível ou

venenoso

Exemplo: Cogumelos Comestíveis x Exemplo: Cogumelos Comestíveis x

VenenososVenenosos

H (altura)

Comestível (^) ¯ Venenoso

W (comprimento)

1 2 3 4

Exemplo: Cogumelos Comestíveis xExemplo: Cogumelos Comestíveis x

VenenososVenenosos

W (comprimento)

1 2 3 4

H (altura) 3

Comestível (^) ¯ Venenoso

Suponha um novo cogumelo com W=3, H=1. Ele é comestível ou venenoso?

Aprendizado de Máquina Aprendizado de Máquina

(Simon, 1983):

“Aprender implica em alterações no sistema que são

adaptativas, no sentido que elas capacitam o sistema a

realizar a mesma tarefa, ou tarefas provenientes da

mesma população, de forma mais eficiente e eficaz na

próxima vez”

(Weiss & Kulikowski, 1991)

“Um sistema de aprendizado [supervisionado] é um

programa de computador que toma decisões baseadas

na experiência contida em exemplos solucionados com

sucesso”

(Russel & Norvig 1995)

“...todo aprendizado pode ser visto como o aprendizado

de uma função”

ConteúdoConteúdo

Introdução

Hierarquia do Aprendizado

Paradigmas de Aprendizado

AM: Conceitos e Definições

Linguagens de Descrição

Hierarquia do Aprendizado Hierarquia do Aprendizado

Aprendizado não Supervisionado

Classificação Regressão

Efetuado a partir de exemplos externos (coletados)

Exemplos estão rotulados (classe é conhecida)

Exemplos não rotulados (não existe classe associada)

Os rótulos assumem valores discretos

Os rótulos assumem valores contínuos

Aprendizado Supervisionado

Aprendizado Indutivo

Exemplos Brutos

Especificação do Problema

Conhecimento do Domínio

Aprendizado de Máquina

Especialista

Avaliação

Hipótese

X1 53 maleX2 140 X3 (^) trueX4 X53.1 (^) downX6 X7 0 sickY 6040 malemale (^140140) truefal (^) 1.4 3 flatup 00 sickbuff 5760 malemale (^165130) truefal (^) 1.4 1 flatup 31 sicksick 4643 femmale 138110 truefal 00 flatup 00 buffbuff 5855 malemale (^120160) truefal 1.80.8 flatflat 01 sicksick 4152 malemale 120172 falfal (^) 0.5 0 upup 00 buffbuff 6243 femmale (^138120) truefal 1.92.5 flatflat 30 sicksick 4756 malemale 110130 truetrue (^) 0.6 1 flatflat 11 sicksick

Aprendizado de MáquinaAprendizado de Máquina

Exemplos

Exemplos Brutos

Especificação do Problema

Conhecimento do Domínio

Aprendizado de Máquina

Especialista

Avaliação

Hipótese

X1 53 maleX2 140 X3 X4true X53.1 (^) downX6 X7 0 sickY 6040 malemale 140140 faltrue (^) 1.4 3 flatup 00 sickbuff 5760 malemale 165130 faltrue (^) 1.4 1 flatup 31 sicksick (^4643) malefem 138110 truefal 00 flatup 00 buffbuff 5855 malemale 120160 faltrue 1.80.8 flatflat 01 sicksick 4152 malemale 120172 falfal (^) 0.5 0 upup 00 buffbuff (^6243) malefem 138120 faltrue 1.92.5 flatflat 30 sicksick 4756 malemale 110130 truetrue (^) 0.6 1 flatflat 11 sicksick

Aprendizado de Máquina Aprendizado de Máquina

Menos Exemplos Compacto (específico)

Mais Compacto (genérico)

Algoritmo de Aprendizado ou Indutor

Exemplos Brutos

Especificação do Problema

Conhecimento do Domínio

Aprendizado de Máquina

Especialista

Avaliação

Hipótese

Aprendizado de MáquinaAprendizado de Máquina

Menos Exemplos Compacto (específico)

Mais Compacto (genérico)

Pode ser usado para fornecer informação já conhecida ao indutor

Pode ser usado ao selecionar os dados

Exemplos Brutos

Especificação do Problema

Conhecimento do Domínio

Aprendizado de Máquina

Especialista

Avaliação

Hipótese

Aprendizado de Máquina Aprendizado de Máquina

Menos Exemplos Compacto (específico)

Mais Compacto (genérico)

Em AM Supervisionado, a hipótese é normalmente chamada de classificador

Categorias de Sistemas de AprendizadoCategorias de Sistemas de Aprendizado

Não Simbólico ou Caixa-preta

Não facilmente interpretado por humanos Desenvolve sua própria representação de conceitos Não fornece esclarecimento ou explicação sobre o processo de classificação

Simbólico ou Orientado a conhecimento

Cria estruturas simbólicas que podem ser compreendidas por seres humanos ”Os resultados da indução devem ser descrições simbólicas das entidades dadas... devem ser compreensíveis como simples ‘pedaços’ de informação, diretamente interpretáveis em linguagem natural...” (Michalski 1983a)

Categorias de Sistemas de Aprendizado Categorias de Sistemas de Aprendizado

A distinção entre essas duas categorias pode ser formulada em termos dos critérios:

critério fraco: o sistema utiliza exemplos para gerar

subsídios para melhorar o desempenho com exemplos

posteriores (ex: redes neurais, métodos estatísticos)

critério forte: o critério fraco é satisfeito e além disso

o sistema é capaz de comunicar sua representação

interna na forma simbólica explicitamente

critério ultra-forte: os critérios fraco e forte são

satisfeitos; o sistema deve ser capaz de comunicar sua

representação interna na forma simbólica

explicitamente e esta pode ser usada por um humano

sem a ajuda de um computador (apenas usando seu

cérebro)

AS xAS x AnSAnS

Aprendizado Supervisionado

Compreender o relacionamento entre os atributos e a

classe

Predizer a classe de novos exemplos o melhor

possível

Aprendizado Não Supervisionado

Encontrar representações úteis dos exemplos, tais

como:

Encontrar agrupamentos (clusters) Redução da dimensão Encontrar as causas ou as fontes ocultas dos exemplos Modelar a densidade dos exemplos

Exemplo Exemplo

Trestbps

Sex

Slope

Number of vessels colored

Exercise induced angina true false

<= 105 > 105 > 0 <= 0

flat or down up

male female

healthy sick healthy

sick healthy

sick

Parte da árvore de decisão induzida por C4.5 para o conjunto de exemplos Cleveland heart disease

ConteúdoConteúdo

Introdução

Hierarquia do Aprendizado

Paradigmas de Aprendizado

AM: Conceitos e Definições

Linguagens de Descrição

Conteúdo Conteúdo

Introdução

Hierarquia do Aprendizado

Paradigmas de Aprendizado

AM: Conceitos e Definições

Linguagens de Descrição

IndutorIndutor

Programa que gera uma hipótese

(classificador) a partir de um conjunto de

exemplos

Conjunto de Exemplos ou Dataset

Classificador

Indutor

Indutor Indutor

Informalmente, o objetivo de um indutor (ou algoritmo de

aprendizado ou algoritmo de indução) consiste em extrair

um bom classificador a partir de um conjunto de exemplos

rotulados

A saída do indutor, o classificador, pode então ser usada

para classificar exemplos novos (ainda não rotulados)

com a meta de predizer corretamente o rótulo de cada um

Após isso, o classificador pode ser avaliado considerando

sua precisão, compreensibilidade ou grau de interesse,

velocidade de aprendizado, requisitos de

armazenamento, grau de compactação ou qualquer outra

propriedade desejável que determine quão bom e

apropriado ele é para a tarefa em questão

Argumentos Dedutivos x IndutivosArgumentos Dedutivos x Indutivos

Argumentos indutivos preservam falsidade

A conclusão contém informação que não está implicitamente ou explicitamente nas premissas

Toda a informação do conteúdo factual da conclusão já está, pelo menos implicitamente, nas premissas

Se todas as premissas são verdadeiras, a conclusão é provavelmente verdadeira, mas não necessariamente verdadeira (à exceção dos argumentos matemáticos indutivos)

Se todas as premissas são verdadeiras então a conclusão é verdadeira

Argumentos Dedutivos Argumentos Indutivos

Argumentos Dedutivos x Indutivos Argumentos Dedutivos x Indutivos

Um exemplo de dedução:

Alguém diz a você “Todas as maçãs são

vermelhas”. A seguir, uma pessoa lhe dá uma maçã. Você infere que ela é vermelha

Um exemplo de indução:

Você vê 5 maçãs vermelhas. Você conclui

“Todas as maçãs são vermelhas”

Suponha que você olhe com mais cuidado as

maçãs e perceba que uma dela é de cor

laranja. Isto falsifica sua conclusão (hipótese)

Exemplo, Atributo & ClasseExemplo, Atributo & Classe

Exemplo

Exemplo, caso ou registro ( instance )

É um conjunto fixo de atributos

Um exemplo descreve o objeto de interesse, tal como

um paciente, exemplos médicos sobre uma

determinada doença ou histórico de clientes de uma

dada companhia

Atributo

Atributo ou campo ( feature )

Uma única característica de um exemplo

Classe

Atributo especial que descreve o fenômeno de

interesse (somente no Aprendizado Supervisionado)

Atributo Atributo

O domínio (conjunto de valores que um

atributo pode assumir) do atributo X (^) i é

indicado por dom(X (^) i )

Exemplo

Atributo sexo; dom(sexo) = {m, f}

Atributo cor; dom(cor) = {verde, vermelho,...}

Atributo temperatura; dom(temperatura) =

{baixa, média, alta}

Atributo peso; dom(peso) = {∀w : w ∈ ℜ+}

Tipos de AtributosTipos de Atributos

Nominal (ou discreto ou categórico ), quando o atributo

assume valores em um conjunto finito, sendo que alguns

indutores podem também aceitar uma subdivisão entre os

atributos nominais:

Ordenado : o domínio é ordenado, mas a diferença absoluta dos valores é desconhecida (e.g. escala de temperatura: baixa, média, alta ou severidade de um machucado) Não-ordenado : não existe uma ordem entre os valores (e.g., cor: vermelho, verde, azul; ocupação; estado civil, raça)

Contínuo (ou numérico ou real ), quando o domínio é

ordenado e pode ser representado por um valor real (e.g.,

peso ∈ ℜ, um número real)

Atributo Atributo

Para qualquer tipo de atributo, usualmente existe

também um símbolo importante que significa desconhecido , ou seja, a ausência de um valor

para aquele atributo

Este símbolo especial é bem diferente, por

exemplo, do valor zero (às vezes usado para números) ou de cadeias de caracteres vazias

Na maioria dos indutores disponíveis, este valor é

representado por um ponto de interrogação?

AtributoAtributo

Um outro símbolo especial, mesmo não

sendo reconhecido por vários indutores, é o

não-se-aplica

Por exemplo, para o atributo número de

gestações , pode ser utilizado o símbolo

não-se-aplica caso o paciente seja do

sexo masculino

Em geral, este símbolo é representado por

um ponto de exclamação!

Atributo Atributo

Além disso, vários indutores assumem que os

atributos originais que descrevem os exemplos

são relevantes o suficiente para aprender a

tarefa em questão

Entretanto, alguns atributos podem não ser

diretamente relevantes e outros até irrelevantes

Um atributo é irrelevante se existe uma descrição

completa e consistente das classes a serem

aprendidas que não usa aquele atributo

Escolha de AtributosEscolha de Atributos

Um ponto importante a ser considerado é a escolha de

atributos com boa capacidade preditiva

Não importa qual método seja empregado, os conceitos

que podem ser aprendidos estão à mercê dos exemplos e

da qualidade dos atributos

Por exemplo, para a tarefa de determinar se uma pessoa

está ou não com gripe, pode-se escolher atributos com

baixo poder preditivo, tais como

(cor-do-cabelo, cor-do-olho, modelo-do-carro, número-de-filhos)

ou atributos com alto poder preditivo, tais como

(temperatura, resistência-da-pele, exame-do-pulmão)

Para esta tarefa específica, no segundo caso, melhores

previsões em exemplos não-rotulados provavelmente

ocorrerão do que com o primeiro conjunto de atributos

Conjuntos de Exemplos Conjuntos de Exemplos

Após induzir uma hipótese, é possível avaliá-la no

conjunto de treinamento bem como no conjunto de teste

É usual denominar as medidas de desempenho de um

classificador efetuadas sobre o conjunto de treinamento

como aparentes (também conhecidas como medidas de

re-substituição ) e as medidas efetuadas sobre o

conjunto de teste como medidas reais (ou verdadeiras )

Por exemplo, caso a medida seja o erro , pode-se ter o

erro aparente e o erro verdadeiro

Para a maioria das hipóteses, a medida aparente é um

estimador ruim do seu desempenho futuro, uma vez que

ela tem a tendência de possuir um bias otimista

Em geral, o erro calculado sobre o conjunto de exemplos de treinamento (erro aparente) é menor que o erro calculado sobre o conjunto de exemplos de teste (erro verdadeiro)

Erro AparenteErro Aparente

Conjunto de Teste

Conjunto de Treinamento

Taxa de Erro (Aparente) do Classificador

Indutor

Erro Verdadeiro Erro Verdadeiro

Conjunto de Teste

Conjunto de Treinamento

Taxa de Erro (Verdadeira) do Classificador

Indutor

Preparação de DadosPreparação de Dados

Fase que antecede o processo de

aprendizagem, para facilitar ou melhorar o

processo.

Exemplos:

remover exemplos incorretos

transformar o formato dos exemplos para que

possam ser usados com um determinado indutor

selecionar um subconjunto de atributos

relevantes (FSS – Feature Subset Selection )

Conhecimento do Domínio Conhecimento do Domínio

Background Knowledge

Informação sobre valores válidos de um atributo

Critérios para escolher atributos

Critérios para escolher hipóteses

Restrições no relacionamento dos atributos

Regras para geração de conceitos de nível mais

alto

Construção de novos atributos derivados dos

atributos originais

X 1 X 2 X 3 X 4 Y overcast 19 65 yes dont_go rain 19 70 yes dont_go rain 23 80 yes dont_go sunny 23 95 no dont_go sunny 28 91 yes dont_go sunny 30 85 no dont_go overcast 19 65 yes go rain 21 80 no go rain 22 95 no go sunny 22 70 no go overcast 23 90 yes go rain 25 81 no go sunny 25 72 yes go overcast 26 75 no go overcast 29 78 no go

RuídoRuído

Exemplos imperfeitos que podem ser derivados do processo de aquisição, transformação ou

rotulação das classes

Ex: exemplos com os mesmos atributos mas com

classes diferentes

Classificador Classificador

Dado um conjunto de exemplos, o

classificador é a saída do indutor

Conjunto de Exemplos ou Dataset

Classificador

Indutor

ClassificadorClassificador

Dado um conjunto de treinamento, um indutor gera como

saída um classificador ( hipótese ou descrição de

conceito ) de forma que, dado um novo exemplo, ele

possa predizer precisamente sua classe

Cada exemplo é um par (x, f(x)), onde

x é a entrada f(x) é a saída (f desconhecida!) y=f(x) assume valores discretos y ∈ {C 1 , C 2 ,…,C k }: classificação y=f(x) assume valores reais: regressão

Indução ou inferência indutiva: dada uma coleção de

exemplos de f(·) , retornar uma função h(·) que aproxima

f(·) , ou seja, h(x) ≅ f(x)

h(·) é denominada uma hipótese sobre a função objetivo

f(·)

Exemplos de Hipóteses Exemplos de Hipóteses

(a) exemplos originais

(b), (c), (d) possíveis hipóteses

(a) (b)

Exemplos de HipótesesExemplos de Hipóteses

Qual a melhor hipótese para os exemplos

em (a)?

(a) (b)

Bias Bias

Qualquer critério de preferência de uma hipótese

sobre outra (além da consistência com os

exemplos)

(a) (b)

VariânciaVariância

Mede quanto as suposições do algoritmo

da aprendizado variam para diferentes

conjuntos de treinamento

Maiores detalhes serão vistos nas

próximas aulas

Idade Renda Classe

20 2000 Ruim

30 5100 Bom

60 5000 Ruim

40 6000 Bom

... ... ...

Espaço de Descrição: ExemploEspaço de Descrição: Exemplo

Assuma o seguinte conjunto de exemplos sobre exemplos

de crédito bancário

Idade

Renda

Ruim

Bom

Espaço de Descrição: ExemploEspaço de Descrição: Exemplo

Induzindo uma Árvore de DecisãoInduzindo uma Árvore de Decisão

Espaço de Descrição: Exemplo Espaço de Descrição: Exemplo

Induzindo uma Árvore de DecisãoInduzindo uma Árvore de Decisão

Idade < 25

Sim Não

Idade

Renda

Ruim

Bom

Espaço de Descrição: ExemploEspaço de Descrição: Exemplo

Induzindo uma Árvore de DecisãoInduzindo uma Árvore de Decisão

Idade < 25

Sim Não

14 - Ruim

0 - Bom

Idade

Renda

Ruim

Bom

Espaço de Descrição: Exemplo Espaço de Descrição: Exemplo

Induzindo uma Árvore de DecisãoInduzindo uma Árvore de Decisão

Idade < 25

Sim Não

Ruim

Idade

Renda

Ruim

Bom

Espaço de Descrição: ExemploEspaço de Descrição: Exemplo

Induzindo uma Árvore de DecisãoInduzindo uma Árvore de Decisão

Idade < 25

Sim

29 - Ruim

19 - Bom

Ruim

Não

Idade

Renda

Ruim

Bom

Espaço de Descrição: Exemplo Espaço de Descrição: Exemplo

Induzindo uma Árvore de DecisãoInduzindo uma Árvore de Decisão

8 - Ruim

0 - Bom

Ruim Renda > 1k

Sim

Não

Idade < 25

Sim Não

Idade

Renda

Ruim

Bom

Espaço de Descrição: ExemploEspaço de Descrição: Exemplo

Induzindo uma Árvore de DecisãoInduzindo uma Árvore de Decisão

Ruim Renda > 1k

Sim

Não

Idade < 25

Sim Não

Idade

Renda

Ruim

Bom

Espaço de Descrição: Exemplo Espaço de Descrição: Exemplo

Induzindo uma Árvore de DecisãoInduzindo uma Árvore de Decisão

Ruim Renda > 1k

Sim

Não

Idade < 25

Sim Não

Idade

Renda

Idade > 45 Ruim

Sim

Não

Ruim

Bom

Espaço de Descrição: ExemploEspaço de Descrição: Exemplo

Induzindo uma Árvore de DecisãoInduzindo uma Árvore de Decisão

Ruim Renda > 1k

Sim

Não

Idade < 25

Sim Não

Idade

Renda

Idade > 45 Ruim

Sim

Não

15 - Ruim

0 - Bom Ruim

Bom

Espaço de Descrição: Exemplo Espaço de Descrição: Exemplo

Induzindo uma Árvore de DecisãoInduzindo uma Árvore de Decisão

Ruim Renda > 1k

Sim Não

Idade < 25

Sim Não

Idade

Renda

Idade > 45 Ruim

Sim Não

Ruim Ruim

Bom

Espaço de Descrição: ExemploEspaço de Descrição: Exemplo

Induzindo uma Árvore de DecisãoInduzindo uma Árvore de Decisão

Ruim Renda > 1k

Sim Não

Idade < 25

Sim Não

Idade

Renda

Idade > 45 Ruim

Sim Não

Ruim Renda > 5k

Sim Não

Ruim

Bom

Qual a Melhor Hipótese? Qual a Melhor Hipótese?

Não Esquecer o Erro...Não Esquecer o Erro...

Conjunto de Teste

Conjunto de Treinamento

Taxa de Erro (Verdadeira) do Classificador

Indutor

Renda

Idade

H4...H4...

Renda

Idade

Conjunto de Teste

Erro de H4 Erro de H

Renda

Idade

Conjunto de Teste

Erro de H1Erro de H

Overfitting Overfitting

A hipótese extraída a partir dos exemplos é muito

específica para o conjunto de treinamento

A hipótese apresenta um bom desempenho para o conjunto de treinamento, mas um desempenho ruim para os casos fora desse conjunto

o (^) o

o o o o

o +

(^) +

o (^) o

o o

4 o^

o +

Hipótese induzida

Novos exemplos fora do conjunto de treinamento

UnderfittingUnderfitting

A hipótese induzida apresenta um

desempenho ruim tanto no conjunto de

treinamento como de teste

poucos exemplos representativos foram dados

ao sistema de aprendizado (e.g. algoritmos de

árvores de decisão ou de indução de regras)

o usuário pré-definiu um tamanho muito pequeno para o classificador (e.g. insuficientes

neurônios em uma rede neural ou um alto valor

de poda para árvores de decisão)

Relação entre o Tamanho do Relação entre o Tamanho do

Classificador e o ErroClassificador e o Erro

Tamanho do Classificador

Erro

N1 N2 N

Conjunto de Teste

Conjunto de Treinamento

Relação entre o Tamanho doRelação entre o Tamanho do

Classificador e o ErroClassificador e o Erro

Tamanho do Classificador

Erro

N1 N2 N

Conjunto de Teste

Conjunto de Treinamento

Underfitting

Overfitting

Consistência e Completude Consistência e Completude

Depois de induzida, uma hipótese pode ser

avaliada sobre

consistência, se classifica corretamente os

exemplos

completude, se classifica todos os exemplos

100

Relação entre Completude e ConsistênciaRelação entre Completude e Consistência

X2 (^) o o o

o (^) o

o o

(^) +

o *^ **

(b)

X2 (^) o o o

o (^) o

o o

(^) +

o *^ **

(a)

X2 (^) oo o

o o

(^) +

o *^ **

(c)

X2 (^) oo o

o o

(^) +

o *^ **

(d)

Completa e consistente Incompleta e consistente

Completa e inconsistente Incompleta e inconsistente

Complexo Complexo

É uma conjunção de disjunções dos atributos de

teste, na forma:

Xi op valor

onde Xi é um atributo, op é um operador

relacional e valor é constante válida para o

atributo Xi

Exemplos

Sexo = Masculino

Idade >= 20

Sexo = Feminino and Idade < 90

RegraRegra

Uma regra assume a forma if L then R que é

equivalente a L → R ≡ R ← L ≡ R :- L

As partes esquerda L e direita R são complexos

sem atributos comuns entre eles, ou seja

atributos(L) ∩ atributos(R) = Ø

A parte esquerda L é denominada condição ,

premissa , antecedente , cauda ou corpo da regra

A parte direita R é denominada conclusão ou

cabeça da regra

109

Linguagens de Descrição Linguagens de Descrição

Lógica de 1ª ordem ou Relacional Pode representar objetos como predicados que especificam propriedades ou relações Cláusulas de Horn são um exemplo Ex: macho(X) ∧ progenitor(Z,X) ∧ progenitor(Z,Y) → irmão(X,Y) ou irmão(X,Y) ← macho(X) ∧ progenitor(Z,X) ∧ progenitor(Z,Y) ou irmão(X,Y) :- macho(X), progenitor(Z,X), progenitor(Z,Y) Lógica de 2ª ordem Extensão da lógica de primeira ordem, em que os predicados podem ser considerados como variáveis Ex: P 1 (X,Y) :- P 2 (X), P 3 (Z,X), P 4 (Z,Y) pode ser instanciado com: irmão(X,Y) :- macho(X), progenitor(Z,X), progenitor(Z,Y) Funções Matemáticas

110

Linguagens de Descrição de AlgunsLinguagens de Descrição de Alguns

IndutoresIndutores

Indutor IDL HDL BDL C4.5 Atributo Atributo CART Atributo Atributo CN2 Atributo Atributo Ripper Atributo Atributo Atributo Foil Atributo Primeira Ordem Primeira Ordem Rede Neural Atributo Função Matemática

111

Características Gerais dos Sistemas

de AM

Modo de Aprendizado

Paradigmas de Aprendizado

Linguagens de Descrição

Formas de Aprendizado

Supervisionado
Não Supervisionado
- Simbólico
- Estatístico
- Instance-Based
- Conexionista
- Genético
  - Exemplos
  - Hipóteses
  - Conhecimento do Domínio - Incremental - Não Incremental

112

Paradigma de

Aprendizado

Classificador Específico para uma Aplicação

Sistema de

Aprendizado

Representação da ClassificaçãoRepresentação da Classificação

Conjunto de Exemplos

Valores dos Atributos

Classes Corretas

Esforço em Cada Etapa Esforço em Cada Etapa

Determinação de Objetivos

Preparação de Dados

Aprendizado de Máquina

Análise & Assimilação

Esforço (%)

EstruturaEstrutura

DadosDados

InformaçãoInformação

ConhecimentoConhecimento

115

Dado, Informação, Conhecimento Dado, Informação, Conhecimento

Dado: é a estrutura fundamental sobre a qual um

sistema de informação é construído

Informação: a transformação de dados em

informação é freqüentemente realizada através

da apresentação dos dados em uma forma

compreensível ao usuário

Conhecimento:

Fornece a capacidade de resolver problemas, inovar e

aprender baseado em experiências prévias

Uma combinação de instintos, idéias, regras e

procedimentos que guiam as ações e decisões

116

Importante Observar que...Importante Observar que...

Dado não é Informação

Informação não é Conhecimento

Conhecimento não é Inteligência

Inteligência não é Sabedoria

Resumo Resumo

Nesta aula foram apresentados conceitos e definições de

alguns termos amplamente utilizados em Aprendizado de

Máquina, além de uma descrição sobre as principais

linguagens de descrição

A investigação de estruturas diferentes, que podem ser

apropriadas para diferentes contextos, bem como o

entendimento do seu poder e limitação são necessários

para o uso com êxito de Aprendizado de Máquina

Quanto maior a compreensão sobre as estruturas

fundamentais usadas por classificadores, mais

adequadamente pode-se aplicar ou alterá-las com base

no conhecimento do domínio

Além da compreensão dos algoritmos de AM, é

igualmente importante poder avaliar seu desempenho, o

que veremos nas próximas aulas

Slides baseados no Capítulo 4 do livro:

Rezende, S.O. (ed).

Sistemas Inteligentes , Manole, 2003,

ISBN 85-204-1683-

Material elaborado por

José Augusto Baranauskas

Revisão 2007

Aprendizagem de Máquina - Conceitos e Definições, Manuais, Projetos, Pesquisas de Inteligência Artificial

Documentos relacionados

Pré-visualização parcial do texto

Baixe Aprendizagem de Máquina - Conceitos e Definições e outras Manuais, Projetos, Pesquisas em PDF para Inteligência Artificial, somente na Docsity!

Aprendizado de MáquinaAprendizado de Máquina

Conceitos e DefiniçõesConceitos e Definições

 Os diversos sistemas de AM

possuem características

particulares e comuns que

possibilitam sua classificação

quanto à linguagem de descrição,

modo, paradigma e forma de

aprendizado utilizados

 Algumas dessas características,

conceitos introdutórios e

definições são introduzidos nesta

aula, os quais são importantes

para a compreensão das aulas

subseqüentes

ConteúdoConteúdo

Introdução

Hierarquia do Aprendizado

Paradigmas de Aprendizado

AM: Conceitos e Definições

Linguagens de Descrição

Aprendizado de Máquina (AM) Aprendizado de Máquina (AM)

Aprendizado de Máquina é uma área de IA cujo

objetivo é o desenvolvimento de técnicas

computacionais sobre o aprendizado bem como a

construção de sistemas capazes de adquirir

conhecimento de forma automática

Um sistema de aprendizado é um programa de

computador que toma decisões baseado em

experiências acumuladas através da solução

bem sucedida de problemas anteriores

Motivação (1)Motivação (1)

Dado um conjunto de objetos, colocar os

objetos em grupos baseados na

similaridade entre eles

Motivação (1) Motivação (1)

Dado um conjunto de objetos, colocar os

objetos em grupos baseados na

similaridade entre eles

Motivação (1)Motivação (1)

Dado um conjunto de objetos, colocar os

objetos em grupos baseados na

similaridade entre eles

x f(x) Dada uma amostra finita, é

freqüentemente impossível

determinar a verdadeira função f(·)

Abordagem: Encontre uma hipótese

( modelo ) nos exemplos de treinamento

e assuma que a hipótese se repita para

exemplos futuros também

 Um pesquisador foi a

campo e coletou diversos

cogumelos

 Ao chegar em seu

laboratório, ele mediu o

comprimento e altura de

cada cogumelo

 Ele também classificou

cada cogumelo coletado

como comestível ou

venenoso

 (Simon, 1983):

“Aprender implica em alterações no sistema que são

adaptativas, no sentido que elas capacitam o sistema a

realizar a mesma tarefa, ou tarefas provenientes da

mesma população, de forma mais eficiente e eficaz na

próxima vez”

 (Weiss & Kulikowski, 1991)

“Um sistema de aprendizado [supervisionado] é um

programa de computador que toma decisões baseadas

na experiência contida em exemplos solucionados com

sucesso”

 (Russel & Norvig 1995)

“...todo aprendizado pode ser visto como o aprendizado

de uma função”

 Não Simbólico ou Caixa-preta

Os diversos sistemas de AM

Algumas dessas características,

Introdução

Hierarquia do Aprendizado

Paradigmas de Aprendizado

AM: Conceitos e Definições

Linguagens de Descrição

Aprendizado de Máquina é uma área de IA cujo

Um sistema de aprendizado é um programa de

Dado um conjunto de objetos, colocar os

Dado um conjunto de objetos, colocar os

Dado um conjunto de objetos, colocar os

Um pesquisador foi a

Ao chegar em seu

Ele também classificou

(Simon, 1983):

(Weiss & Kulikowski, 1991)

(Russel & Norvig 1995)

Não Simbólico ou Caixa-preta

Simbólico ou Orientado a conhecimento

critério fraco: o sistema utiliza exemplos para gerar

critério forte: o critério fraco é satisfeito e além disso

critério ultra-forte: os critérios fraco e forte são

Compreender o relacionamento entre os atributos e a

Predizer a classe de novos exemplos o melhor

Encontrar representações úteis dos exemplos, tais

Informalmente, o objetivo de um indutor (ou algoritmo de

A saída do indutor, o classificador, pode então ser usada

Após isso, o classificador pode ser avaliado considerando

Exemplo, caso ou registro ( instance )

É um conjunto fixo de atributos

Um exemplo descreve o objeto de interesse, tal como

Atributo ou campo ( feature )

Uma única característica de um exemplo

Atributo especial que descreve o fenômeno de

Nominal (ou discreto ou categórico ), quando o atributo

Contínuo (ou numérico ou real ), quando o domínio é

Um ponto importante a ser considerado é a escolha de

Não importa qual método seja empregado, os conceitos

Por exemplo, para a tarefa de determinar se uma pessoa

ou atributos com alto poder preditivo, tais como

Para esta tarefa específica, no segundo caso, melhores

Após induzir uma hipótese, é possível avaliá-la no

É usual denominar as medidas de desempenho de um