textanalysis.booklet
textanalysis.booklet.booklet0
- class textanalysis.booklet.booklet0.Ex01(text=None)[código fonte]
Implementa a atividade descrita em Apostila 0 Exercitando 01
- Parâmetros
text (str) – Texto a ser utilizado como base para o exercício.
- property text: str
Texto a ser utilizado pela classe
Propriedade ser utilizado pelos outros métodos da classe. Se for atribuído
None
, será convertido para uma string vazia.
- property text_chars: iter[str]
Cria um gerador para os caracteres individuais do texto.
- Retorna
Iterador dos caracteres de
text
- property text_split: iter[str]
Divide o texto em uma lista de palavras
Divide o texto em uma lista de palavras, separadas por um espaço em branco, e cria um gerador para os itens da lista.
- Retorna
Iterador das palavras de
text
- property text_split_len: int
Contabiliza o tamanho da lista do iterador
text_split
- Tipo de retorno
- Retorna
Tamanho da lista
text_split
- text_replace(old, new)[código fonte]
Substitui
old
pornew
Substitui o trecho de
text
indicado pelo parâmetroold
pelo texto indicado no parâmetronew
- text_segment(first, last=None)[código fonte]
Retorna o segmento do texto entre
first
elast
Retorna o segmento do texto indicado, da posição inicial
first
até a posiçãolast
, ambos INCLUSIVO, ou seja, retorna o caracter das posições indicadas. Selast
for omitido, retorna apenas o caracter indicado porfirst
- Levanta
ValueError – Se
first
é menor ou igual a zero ou menor quelast
- Parâmetros
- Tipo de retorno
- Retorna
String com o segmento do texto ou uma string vazia se
first
for maior que o tamanho do texto
- text_last(n)[código fonte]
Retorna os últimos caracteres do texto, de tamanho indicado pelo parâmetro
n
, que é opcional com valor padrão15
.- Parâmetros
n (int, opcional) – Tamanho do segmento.
- Levanta
IndexError – se o tamanho do segmento é maior que o texto em si.
- Tipo de retorno
- Retorna
Segmento do texto dos últimos
n
caracteres.
- text_save(filename)[código fonte]
Salva o texto em um arquivo indicado pelo parâmetro
filename
.
- class textanalysis.booklet.booklet0.Ex02(docname)[código fonte]
Implementa a atividade descrita em Apostila 0 Exercitando 02
- Parâmetros
docname (str) – Caminho do arquivo
docx
a ser carregado.
- property paragraphs: iter[str]
Cria um iterador para os parágrafos encontrados no documento.
- Retorna
iterador dos parágrafos no documento
- property paragraphs_list: list[str]
Cria uma lista contendo cada parágrafo encontrado no documento.
- property paragraphs_len: int
Contabiliza o tamanho da lista do gerador criado por
Exercitando02.paragraphs()
.- Tipo de retorno
- Retorna
Tamanho da lista.
- paragraphs_segment(first, last=None)[código fonte]
Retorna os parágrafos do documento, da posição inicial
first
até a posiçãolast
, ambos INCLUSIVO, ou seja, também retorna os parágrafos nas posições indicadas. Selast
for omitido, retorna apenas o parágrafo indicado porfirst
.- Levanta
ValueError – Erro gerado quando
first
é menor ou igual a zero ou quandofirst
menor quelast
.- Parâmetros
- Tipo de retorno
- Retorna
Uma lista de string com os parágrafos solicitados, ou uma única string de parágrafo de
last
for omitido.
- paragraphs_hastext(text)[código fonte]
Verifica se a string indicado pelo parâmetro
text
existe no documento.
- property paragraphs_text: str
Retorna uma string com o conteúdo do documento.
- Tipo de retorno
- Retorna
String do documento.
- paragraphs_replacetext(old, new)[código fonte]
Retorna uma string com o conteúdo do documento, substiuindo o texto indicado pelo parâmetro
old
pornew
.
textanalysis.booklet.booklet1
- class textanalysis.booklet.booklet1.Ex01[código fonte]
Implementa a atividade descrita em Apostila 1 Exercitando 01
- property corpus: nltk.corpus.reader.plaintext.CategorizedPlaintextCorpusReader
- Tipo de retorno
- Retorna
O Corpus carregado dos arquivos na pasta de dados
- findid(fid, category=None)[código fonte]
Encontra o fileid desejado no
corpus
- words(fileid, category=None)[código fonte]
Iterador das palavras do corpus com ID
fileid
- class textanalysis.booklet.booklet1.Ex02(docfile)[código fonte]
Implementa a atividade descrita em Apostila 1 Exercitando 02
- property doc: docx.api.Document
- Tipo de retorno
Document
- Retorna
Documento em formato docx
- property bigrams: iter[BiGram]
- Retorna
Iterador de tupla
- property trigrams: iter[TriGram]
- Retorna
Iterador de tupla
- top_bigrams(top=20)[código fonte]
- Parâmetros
top (int) –
- Retorna
Iterador de tupla
- top_trigrams(top=20)[código fonte]
- Parâmetros
top (int) –
- Retorna
Iterador de tupla
- class textanalysis.booklet.booklet1.Ex03(file)[código fonte]
Implementa a atividade descrita em Apostila 1 Exercitando 03
- property tokens_freq: nltk.probability.FreqDist
- Tipo de retorno
- property words_freq: nltk.probability.FreqDist
- Tipo de retorno
- tokens_freq_plot()[código fonte]
- Tipo de retorno
- property bigrams: iter[BiGram]
- quadrigrams(word=None)[código fonte]
- class textanalysis.booklet.booklet1.Ex04[código fonte]
- textanalysis.booklet.booklet1.ex04()[código fonte]