When you enroll through our links, we may earn a small commission—at no extra cost to you. This helps keep our platform free and inspires us to add more value.

Text Mining no R: extração, informação, análise, documento
Aprenda a transformar o texto em dados para análise, por meio da aplicação do processamento de linguagem natural (PLN)
This Course Includes
udemy
4.7 (54 reviews )
2h 18m
english
Online - Self Paced
professional certificate
Udemy
About Text Mining no R: extração, informação, análise, documento
Os dados não estruturados representam mais de 80% de tudo que circula na internet. A disponibilização de dados nesta nova forma de armazenamento é cada dia mais crescente em todas as organizações mundiais. Um grande desafio é entender o que textos, sites, arquivos em formatos word, pdf, etc podem nos trazer de informações relevantes e qual seria esta amplitude. Pensando nisso, foi criado o curso
Text Mining no R: extração, informação, análise, documento
que visa entender o processo de obtenção de informações importantes de um texto com base na recuperação de informações, extração de dados, aprendizado de máquina, estatísticas e linguística computacional que são tarefas típicas de mineração de texto, que incluem categorização e agrupamento de texto, extração de conceito/entidade, produção de taxonomias granulares, análise de sentimentos. O curso é trabalhado com diversos práticas em arquivos texto, inclusive com o uso de _web scrapping_ , ou seja, coleta de dados web ou raspagem web, é uma forma de mineração que permite a extração de dados de sites da web convertendo-os em informação estruturada para posterior análise.
Para isso você conta:
· Acesso total vitalício ao conteúdo do curso; · Certificado de conclusão do curso oferecido pela Udemy; · Acesso no seu dispositivo móvel e TV ou Computador; · Acesso 24h / 7 dias por semana aos instrutores usando a seção de Perguntas e Respostas.
SEJA MAIS UM ALUNO DESTE CLUBE QUE NÃO PARA CRESCER!
What You Will Learn?
- Processo de obtenção de informações importantes de um texto .
- Recuperação de informações, extração de dados, aprendizado de máquina, estatísticas e linguística computacional .
- Agrupamento de texto, extração de conceito/entidade, produção de taxonomias granulares, análise de sentimentos .
- Nuvem de Palavras .
- Corpus .
- Tokenização .
- Tokens .
- Frequência de Palavras .
- Stopwords .
- Processo de Text Mining .
- Utilização de pacotes: BiocManager, rvest, stringr,lexiconPT,widyr, ggraph, igraph, tibble .
- Utilização de pacotes: TM, tidyr, ggplot2, SnowballC, dplyr, tidytext, wordcloud, RColorBrewer .
- Ajustes e transformação nos textos: radicais, eliminação de espaços em branco, palavras indesejadas .
- Criação de Matriz Termo Documento .
- Correlação entre textos, palavras mais ditas, associação entre palavras .
- Análise de Sentimento .
- Web scraping .
- Comandos: VCorpus, inspect, meta, lapply, tm_map, stopwords, documentTermMatrix, findFreqTerms .
- Comandos: FindAssocs, bind_tf_idf, count, arrange, filter, geom_col, unnest_tokens, anti_join, pairwise_cor .
- Comandos: Inner_join, group_by, summarize, mutate, barchart, str_c, str_detect, str_subset, str_which, str_count, str_replace_all .
- Comandos: Tolower, removePunctuation, removeNumbers, stripWhitespace, stemDocument .
- Estudo de Ngrams, em especial Bigrams Show moreShow less.
