Precisa de uma abordagem pessoal e exclusiva?

Para que gastar seu tempo procurando trabalhos prontos online? Tente nosso serviço agora mesmo!

Noção de Haste e Lote de Folhas

Quanto maior a matriz dos dados analisados, mais difícil é se concentrar em suas principais características. Para melhor absorver as informações contidas no conjunto de dados, elas devem ser organizadas adequadamente. Para fazer isso, o array ordenado ou o diagrama de haste e folha são usados. Além do gráfico de hastes e folhas, existem várias estruturas de dados clássicas que permitem armazenar uma grande quantidade de informações necessárias e fornecer a capacidade de recuperá-las e alterá-las rapidamente. Quais dessas estruturas (gráfico de raiz e folha ou qualquer outra coisa) é a mais eficaz para uma tarefa específica é definida por um conjunto de consultas (e sua freqüência relativa) para modificar e recuperar informações.

Abaixo, tentaremos avaliar a eficácia de várias dessas estruturas de dados clássicas, incluindo o diagrama de hastes e folhas.

Matriz desordenada

A opção mais simples é manter todos os registros na memória (ou no disco) um após o outro.

O novo registro será adicionado ao final da matriz, o que será feito por um período específico de tempo O (1), ou seja, um pequeno período de tempo finito que não depende de N.

No entanto, as funções de pesquisa e exclusão serão longas. A única maneira de encontrar o item desejado em um array desordenado é ordenar sequencialmente seus elementos e comparar elementos-chave com a chave que precisamos (no nosso caso, a chave é um sobrenome; a chave é um campo, que é usado para o pesquisa, geralmente a chave é um identificador único da gravação). Assim, até encontrar o registro necessário, o algoritmo pesquisará em média metade dos registros, ou seja, o custo do tempo será cerca de N / 2. Muitas vezes acontece que a coisa está sendo procurada no arquivo não está lá, e o algoritmo terá que pesquisar em uma matriz de registros gastando tempo N. A velocidade estimada do computador é a seguinte: em um segundo é visto 1 milhão registros.

Se você tiver 100 milhões de registros, a operação de pesquisa poderá levar 100 segundos, e isso é muito.

O mesmo se aplica à função de exclusão. Para deletar, primeiro temos que encontrar um registro de extração. Então você precisa mover os registros que vão depois em uma unidade para a esquerda para remover o buraco formado. Se o primeiro elemento da matriz for excluído, é necessário passar para o segundo lugar, primeiro para o lugar, para o segundo e assim por diante. No geral, você precisará fazer movimentos N-1. Em média, haverá movimentos N / 2 e são mais demorados que a leitura.

Para nós, o importante é que o tempo de busca e exclusão cresça linearmente com o N. O coeficiente antes de N não é tão importante, então nós não o escrevemos (e na verdade não podemos calculá-lo sem ter uma máquina específica e a implementação do algoritmo). O próximo é o gráfico de caules e folhas.

Haste e Lote de Folhas

O gráfico da haste e da folha é a representação das amostras de dados medidas em uma escala de intervalo. O talo de caules e folhas foi inventado por John Tukey. É frequentemente usado na análise exploratória de dados para ilustrar as características essenciais da distribuição de dados em um formato conveniente e de fácil leitura.

O gráfico da haste e da folha é semelhante a um histograma, mas geralmente é mais informativo para conjuntos de dados relativamente pequenos (<100 pontos). Além do gráfico, há uma tabela no gráfico de tronco e folha, que facilita a gravação de dados na ordem de alteração de seus valores, o que pode ser útil para muitos procedimentos estatísticos.

Podemos comparar diferentes conjuntos de dados por meio de vários gráficos de hastes e folhas. Usando parcelas adjacentes, podemos comparar os valores das mesmas características em amostras pareadas, por exemplo, a freqüência cardíaca de fumantes e não-fumantes após exercícios.

Stem e plot de folhas constituem uma combinação de gráficos de barras e lista tabular. Como no histograma, o comprimento de cada linha corresponde ao número de observações que se enquadram em um determinado intervalo. Além disso, o gráfico de caules e folhas mostra o valor numérico para cada observação. Para isso, o valor numérico é dividido em dois componentes - tronco com ramificações, cada uma representando o primeiro dígito ou um grupo de dígitos, e folha que representa os próximos dígitos. O caule é consistente com aqueles graus de valores numéricos observados que não mudam. As folhas correspondem às fileiras que mudam dentro do intervalo escolhido.

Stem and leaf plot é uma ferramenta para organização visual de aquisição de dados e análise de sua distribuição. Os dados no gráfico são distribuídos de acordo com os primeiros dígitos (hastes) e os dígitos finais (folhas). Por exemplo, o número 18.9 no caule e na parcela da folha inclui o caule 18 e a folha 9.

Infelizmente, o Excel não cria automaticamente o gráfico de tronco e folha. Portanto, é necessário construir o talo de haste e folha manualmente. Como o caule, vamos usar a parte inteira da temperatura e, como folhas, vamos usar uma parte decimal.

Stem e enredo de folha visualiza uma grande variedade de informações. Por exemplo, é possível determinar diretamente a temperatura mínima e a temperatura máxima no tronco e na parcela de folhas. É evidente que a maioria dos valores se enquadra no intervalo de 16 ... 20 ° C, e os valores reais formam uma distribuição normal com um valor médio de cerca de 18 ° C. Além disso, há uma cauda razoavelmente larga nos grandes valores quando se usa o diagrama de caules e folhas.

Uma matriz ordenada

A idéia da matriz ordenada é se os registros são ordenados, é mais fácil procurá-los. De fato, se os sobrenomes estão em ordem alfabética, é muito mais fácil encontrar o sobrenome correto: procure no meio da lista e veja onde está o sobrenome necessário - abaixo ou acima. Na parte direita, olhamos novamente para o meio e vemos para onde temos que apontar nossos olhos - para baixo ou para cima. Esse método de busca é chamado de busca dividindo ao meio (busca binária, método de divisão ao meio, dicotomia).

Agora vamos ver quanto tempo precisamos para que as operações adicionem e removam entradas.

A remoção de uma matriz ordenada será mais rápida, pois encontraremos o item excluído mais rapidamente. Mas, novamente, você precisa executar uma média de N / 2 operações de deslocamento dos elementos para remover o buraco resultante na matriz, de modo que o assintótico de um período médio de tempo de operações de remoção será o mesmo - O (N).

A operação de adicionar um elemento em um array ordenado consome muito tempo. Ao adicionar queremos manter a propriedade de ordenar. Não podemos simplesmente adicionar o item ao final do array. Precisamos encontrar um lugar para ele na matriz e, em seguida, empurrá-lo para criar um caminho para o novo elemento (isto é, mover itens para um à direita do último elemento). Em média, precisaremos fazer turnos N / 2, o que significa que assintóticos são O (N).

Assim, classificando a matriz, não recebemos uma melhoria significativa: a pesquisa ficou mais rápida, mas o tempo médio para adicionar um novo registro aumentou muito.

Conclusão: o armazenamento de dados em uma matriz ordenada só será efetivo se eles não forem alterados, ou seja, quando as exclusões e as consultas não ocorrerem.

Uma lista desordenada

A ideia deste diagrama é que passamos muito tempo em matrizes movendo a cauda de um array. Isso pode ser evitado usando listas.

List é uma estrutura de dados para armazenar a sequência de elementos. Os itens da lista não estão localizados estritamente na memória, mas aleatoriamente. A sequência é construída devido ao fato de que cada elemento da lista conhece (contém informações) sobre o fato, onde o item seguinte e o anterior da lista estão localizados na memória.

A lista é chamada duplamente conectada se cada elemento contiver informações sobre os locais onde o item seguinte e o item anterior estão localizados na lista. Se o elemento contiver informações apenas sobre o próximo item, a lista é chamada simplesmente conectada.

Para inserir um elemento dentro de uma lista simplesmente conectada, você precisa quebrar uma única seta e adicionar duas novas (para uma lista duplamente vinculada, você precisa quebrar duas setas e adicionar quatro delas).

Podemos navegar pelos itens para trás e para frente na lista duplamente vinculada, mas não podemos nos mover rapidamente para o meio da lista. Para chegar ao elemento N / 2, você precisa mover N / 2 para o próximo item, começando com o primeiro.

Portanto, não há necessidade de criar uma lista ordenada, porque não poderemos pesquisar dividindo pela metade.

Assim, a operação de adicionar e remover um item da lista leva o tempo O (1). A busca do elemento, como na matriz desordenada, leva uma média do tempo O (N).

Gráfico de Pareto

O gráfico de pareto é um gráfico de barras, cujas colunas correspondem a diferentes valores de algumas variáveis ​​categóricas. A altura de cada coluna representa a frequência de ocorrência dos valores relevantes e as colunas são organizadas em ordem descendente de frequência. Além disso, o diagrama também inclui a linha poligonal de porcentagem cumulativa que permite determinar a frequência total, expressa em porcentagens, ad dois, três, etc., dos valores mais comuns da variável categórica.

A aplicação do gráfico de Pareto é razoável e eficaz, por exemplo, em tarefas relacionadas a problemas de qualidade. Vamos supor que estudamos um grupo de componentes abaixo do padrão de alguma coisa e classificamos cada unidade de acordo com a causa do defeito. Neste caso, o gráfico de Pareto mostra várias causas de defeitos, ordenadas de mais para menos freqüentemente ocorrendo (gráfico de barras) e, além disso, a porcentagem de defeitos causados ​​por dois, três, quatro, etc. das razões mais comuns. / p>

Como funciona?

O estudante
Faz o pedido

O livro «Medicine River» é interessante e atraente para os leitores. Existem algumas situações

Escritores fazem
suas propostas

O livro «Medicine River» é interessante e atraente para os leitores. Existem algumas situações

O estudante
contrata um eskritor

O livro «Medicine River» é interessante e atraente para os leitores. Existem algumas situações

O escritor produz
o trabalho

O livro «Medicine River» é interessante e atraente para os leitores. Existem algumas situações

Você triturou para o tempo?

Temos melhores preços, confira você mesmo!

Deadline
Pages
~ 550 words
Nosso Preço
R$ 0
Preço dos concorrentes
R$ 0

VOCE PODE GOSTAR