Friday, 14 July 2017

Mudança Média Janela Stata


OxMetrics Help O sistema TMM da OxMetrics apresenta um sistema orientado a gráficos orientado por menu interativo para análise econométrica, estatística e financeira. Aqui descrevemos o programa central OxMetrics, que atua como front-end de uma série de módulos de software integrados. Esses módulos obtêm seus dados da OxMetrics e retornam saída e gráficos para ele. O OxMetrics é o componente que permite que você carregue, edite e salve dados que os dados usando a calculadora ou a álgebra criam uma grande variedade de gráficos, que podem ser editados, alterados e salvos em vários formatos, fornecendo dados para outros módulos para analisar a receita. A saída de texto, os resultados e os gráficos e permite que você edite, modifique e guarde qualquer ou todos estes, conforme desejado. Como tal, o front-end da OxMetrics pode ser visto como a área de trabalho para modelos econométricos e estatísticos. Os bancos de dados OxMetrics podem ter uma freqüência fixa, ou datada, que permite dados diários ou cronometrados. São proporcionadas instalações de agregação, e. Para converter dados diários em mensalmente. O OxMetrics é multilíngüe, na medida em que nomes de variáveis ​​de banco de dados e texto em relatórios e gráficos podem ser de uma ampla gama de idiomas, incluindo chinês e japonês. 1.1 Plataformas suportadas O conjunto de programas da OxMetrics é executado nas seguintes plataformas: a Instalação é para Programar FilesOxMetrics7 por padrão, mas isso pode ser alterado no programa de instalação. A instalação é para ApplicationsOxMetrics7. A instalação é para usrshareOxMetrics7. Um documento de instalação separado descreve as plataformas suportadas com mais detalhes e mostra como instalar o software. O OxMetrics 7 opera independentemente da versão 6. 1.1.1 Estrutura da pasta A estrutura da pasta OxMetrics é a seguinte: 1.2 O que é novo Esta documentação refere-se a OxMetrics 7. Os usuários do OxMetrics 6 encontrarão muito que seja familiar. Há uma série de pequenas correções nesta versão, que estão documentadas na ajuda on-line. Os novos recursos mais importantes do OxMetrics 6 são: o gerenciamento de saída é mais rápido no Linux e muito mais rápido no OS X. Os gráficos QQ normais agora podem incluir bandas de erro padrão assintóticas 95. Uma variável pode ser usada para adicionar Shading a um gráfico: o sombreamento é ativado quando a variável tem valor 1. Isso permite sombreamento de recessão e é usado em particular para a saída dos modelos de comutação de regime. As legendas podem ser transparentes ou não. Lendas transparentes não são transparentes para sombrear ou separar símbolos. As lendas opacas são desenhadas em cima de tudo o resto. Menu de contexto adicionado (gráfico, classificação). Ao clicar com o botão direito do mouse no nome da variável em um banco de dados. 1.3 Disponibilidade Consulte doornik ou oxmetrics. net para obter informações adicionais relevantes para as versões atuais e futuras da OxMetrics. Uma versão de demonstração também está disponível a partir desses sites. O menu Suporte de ajuda lista alguns endereços de contato para OxMetrics, bem como fontes de informações da web. 1.4 Citação Para facilitar a replicação e validação de achados empíricos, o módulo usado para gerar os resultados deve ser citado em todos os relatórios e publicações envolvendo sua aplicação. O OxMetrics incorpora um extenso sistema de ajuda de referência cruzada que oferece conselhos sobre decisões cruciais e pode ser acessado a qualquer momento. Isso é baseado em arquivos HTML e requer que um navegador como o Chrome, o Firefox ou o Internet Explorer esteja instalado. A ajuda do OxMetrics está disponível no menu Ajuda ou no painel de Ajuda no espaço de trabalho. O painel de Ajuda lista os conteúdos de todos os módulos que foram instalados no OxMetrics. Clicar duas vezes em uma entrada iniciará seu navegador padrão com o conteúdo da Ajuda. A ajuda dependente do contexto, quando disponível, pode ser obtida pressionando a tecla F1 ou no menu Ajuda. Por exemplo, ao escrever um programa Ox, coloque o cursor no println e pressione F1. O OxMetrics procurará os arquivos de índice html para uma referência a essa palavra. Se houver apenas um, ele irá pular lá imediatamente. Caso contrário, oferecerá uma lista de escolhas em uma caixa de diálogo. 1.6 Estrutura modular OxMetrics mantém a estrutura modular que foi introduzida em gerações anteriores do software. Um número crescente de módulos interage com o OxMetrics. Nesse caso, o front-end do OxMetrics é o servidor, enquanto os módulos (TSP, STAMP, etc.) são os clientes. A comunicação é implementada via DDE. Embora seja possível escrever clientes que interagem diretamente com o servidor (como TSP, OxPack e OxRun), é muito mais fácil desenvolver pacotes de Ox que fazem isso. Isso requer o uso da classe Modelbase, que fornece a funcionalidade necessária. Exemplos disso são PcGets, PcGive, Grch, etc. O Ox é uma poderosa linguagem de programação de matriz orientada a objetos com uma extensa biblioteca estatística. O boi permite que você escreva seus próprios programas usando operações de matriz de alto nível e fornece facilidades fáceis de ler os mesmos arquivos de dados que o OxMetrics pode carregar. Quando as opções pré-programadas em outros módulos não fornecem um estimador ou teste necessário, e você possui algumas habilidades básicas de programação, Ox poderia ser usado em vez disso. O boi também possui aulas pré-programadas (uma classe é um termo na programação orientada a objetos) para facilitar a escrita de experiências de Monte Carlo. O boi tende a ser mais rápido que outras linguagens de matriz populares. Consulte a documentação separada do boi para obter mais informações. O aplicativo de diálogo OxRun permite executar programas da Ox com o OxMetrics como destino de texto e saída gráfica. Um exemplo interessante que mostra densidades e lotes QQ enquanto um experimento de Monte Carlo está em andamento é fornecido em oxsamplessimulasimnor. ox. O módulo OxPack fornece um front-end interativo para vários pacotes Ox. 1.7 Registro É necessário um código de licenciamento para que o software funcione corretamente. Este código será fornecido com sua cópia e, em circunstâncias normais, a licença que é inserida durante a instalação é usada automaticamente pelo software. Licenças adicionais podem ser inseridas na opção do menu Registo de Ajuda (uma caixa de diálogo aparecerá automaticamente quando a OxMetrics não estiver registrada). No diálogo subseqüente você pode inserir seu código, bem como seu nome e afiliação. O Registro de Ajuda também pode ser usado para verificar as licenças disponíveis para usar os módulos do cliente. 1.8 Atualizações 1.9 Álgebra A linguagem Álgebra permite transformar variáveis ​​de banco de dados escrevendo fórmulas matemáticas. O código de álgebra pode ser escrito de forma interativa na Calculadora. Ou diretamente no editor de Álgebra. Esse código de álgebra pode ser salvo, recarregado e editado. A Calculadora escreve suas operações como código de álgebra para a janela Resultados, de onde pode ser cortado e colado no editor de álgebra. A álgebra também pode ser executada diretamente a partir da janela de resultados, destacando o bloco de código de álgebra e, em seguida, pressionando CtrlA. A álgebra é uma linguagem de vetor simples, operando nas variáveis ​​no banco de dados. A operação é aplicada a cada observação por sua vez, embora seja possível limitar o acesso a uma subamostra. A sintaxe é descrita na álgebra do capítulo. 1.10 Batch OxMetrics é um programa orientado por menus para facilidade de uso, mas algumas operações podem ser implementadas ao inserir comandos. Esses comandos são partes de linguagem de computador simples que permitem algum controle de OxMetrics através de operações em lote. Um programa em lote pode conter seções do código de álgebra. Os arquivos em lote permitem que você carregue dados, adicione resultados, implemente a álgebra e guarde os modelos atuais do PcGive (ou STAMP etc.). Mais tarde, estes podem ser executados a partir do menu ModelBatch ou clicando no ícone OxMetrics na barra de ferramentas. Assim, quando um modelo complicado foi criado de forma interativa, ele pode ser salvo como um arquivo em lotes para posterior edição ou fácil recuperação em uma sessão posterior. Esta é também a maneira mais conveniente de criar um arquivo em lote. Como Algebra, o código do lote pode ser executado diretamente destacando o bloco de texto e, em seguida, pressionando CtrlB. Uma vez guardado no disco, um arquivo em lote também pode ser executado diretamente usando File Open. Ou mesmo clicando duas vezes no arquivo de lote no Windows Explorer. Os arquivos em lote têm a extensão. fl, que originalmente significava Fiml Language. A sintaxe é descrita no Capítulo lote. 1.11 Armazenamento de dados O modo principal de armazenamento de dados é um par de arquivos com extensões. In7 and. Bn7. O último é um arquivo binário contendo os dados reais, enquanto o primeiro contém as informações sobre o conteúdo do arquivo binário, como nomes de variáveis, períodos de amostra, freqüências, etc. O arquivo de informações é um arquivo legível por humanos, o. bn7 é binário E não é legível por humanos. Um conjunto de dados artificiais é fornecido na pasta OxMetrics7data, nos arquivos chamados data. in7 e data. bn7. Os tutoriais usam este conjunto de dados. Se você quiser carregar seus próprios dados, você deve começar por inserir as observações no entanto, siga primeiro o tutorial relevante. A OxMetrics verifica se há possível substituição de arquivos e, se for provável que ocorra, permite selecionar outro nome de arquivo. As opções de dados facilitam o fácil arquivamento de dados. Tenha cuidado para não substituir conjuntos de dados preciosos. É sempre sábio fazer backups regulares de arquivos importantes: os discos rígidos podem quebrar, a exclusão acidental ocorre ou os vírus podem atacar. O OxMetrics pode ler e escrever arquivos legíveis por humanos e arquivos de planilha do Excel. O OxMetrics também pode ler arquivos separados por vírgulas, GAUSS e Stata. 1.12 Nomes de arquivos e extensões Todos os nomes de arquivos possuem extensões padrão automáticas que não precisam ser inseridas. Diga que o conjunto de dados básicos é chamado m1ukq, então o arquivo de informações pode ser m1ukq. in7. O arquivo binário associado (de dados reais) será m1ukq. bn7. O arquivo de armazenamento da janela OxMetrics Results poderia ser m1ukq. out. O arquivo de armazenamento de álgebra m1ukq. alg. E arquivos em lote m1ukq. fl. Um arquivo de dados básico legível por humanos geralmente usa a extensão. dat. Os arquivos de gráfico permitem a gravação em PostScript encapsulado (.eps), PDF (.pdf), PostScript (.ps), metadifos do Windows (.wmf), metarquivos aprimorados (.emf) e gráficos OxMetrics (.gwg, para gráficos GiveWin), Dos quais o último pode ser re-lido pela OxMetrics para edição posterior. Observe que, por padrão, o Windows não mostra a extensão do arquivo na janela do Explorer --- somente o ícone mostra qual é o tipo de arquivo. Se desejar, você pode alternar a exibição de extensões de arquivo na entrada Opções de pasta no Explorer. 1.13 Armazenamento de saída Todas as saídas de texto são mostradas na janela Resultados, conforme os cálculos prosseguem, mas não são armazenados no disco ou disquete, a menos que seja solicitado especificamente. Em corridas longas, uma grande quantidade de informações pode ser gerada. Isso pode ser editado para eliminar registros redundantes: o menu Editar permite copiar, cortar, colar, excluir, encontrar e substituir. A instalação de armazenamento permite que o modelagem interativa rápida prossiga, enquanto qualquer resultado útil pode ser impresso como um trabalho em lote quando o computador estiver ocioso. Uma vez que grande parte da saída é gráfica, os gráficos podem ser facilmente editados. Os gráficos podem ser salvos em uma variedade de formatos conforme observado na próxima seção. 1.14 Períodos de amostra Para amostras de dados, a referência é na data absoluta no formulário Ano (Período) a Ano (Período). Por exemplo: 1965 (1) a 1985 (3). Sempre que uma escolha de amostra deve ser feita, a OxMetrics mostrará o máximo disponível e não permitirá escolhas fora desse intervalo. Quando os dados são datados, por exemplo consistindo de dados diários, a escolha é feita digitando datas no formato ISO de aaaa-mm-dd. O ano é sempre quatro dígitos, o mês com um ou dois dígitos (1 de janeiro) e a data também um ou dois dígitos. Por exemplo: 1965-1-31 a 1985-9-5. O tempo é escrito como hh: mm: ss. uuu onde a hora é de dois dígitos no relógio de 24 horas (então 22:00 é 10 PM), mm é minutos, os segundos e as centenas são opcionais. Quando combinado com uma data, o padrão ISO usa um T para colar as peças juntas: 1980-1-1T12: 05: 05. 1.15 Barra de status A barra de status é exibida na parte inferior da janela OxMetrics e consiste em quatro áreas: A área esquerda da barra de status descreve as ações dos itens do menu, pois você usa as teclas de seta para navegar pelos menus. Esta área mostra de forma semelhante mensagens que descrevem as ações dos botões da barra de ferramentas à medida que as pressiona, antes de liberá-las. Se, depois de visualizar a descrição do comando do botão da barra de ferramentas, você não deseja executar o comando, então solte o botão do mouse enquanto o ponteiro estiver fora do botão da barra de ferramentas. Se uma ferramenta estiver em execução, isso é indicado em um fundo amarelo no segundo painel. O terceiro painel mostra a localização do documento atual. O conteúdo é diferente para texto, dados e gráficos. Para o texto é a posição no documento do cursor. Por exemplo: L 113 C 14 indica que o cursor está na linha 113, coluna 14. No modo de exibição hexadecimal binário, esta mostra a posição do cursor em decimal (o primeiro caracter do documento é no byte 0). Este campo também indicará se o documento é somente leitura ou quando o editor está no modo de sobreposição. Para dados, é a posição no banco de dados do cursor. Se houver uma seleção ativa, ele mostra as variáveis ​​selecionadas. Para gráficos, é a coordenada X do cursor do mouse. A área direita da barra de status também depende do tipo de documento: Para o texto, indica as propriedades de codificação do documento: Marcador de fim de linha Um de: Win, Lnx, Mac para Windows (rn), Linux (n) ou Mac ( R). Formato de arquivo multilíngüe Se o formato do arquivo for diferente da codificação padrão (ASCII), isso é indicado por um de UTF8, UTF16 ou UTF32. A BE pode ser seguida por BE ou LE para codificação big-endian ou little-endian indicada. Essas propriedades podem ser alteradas usando as propriedades do EditText. Para os dados é o valor da observação que tem o cursor. Se houver uma seleção ativa, ele mostra a amostra selecionada. Para os gráficos, é a coordenada Y do cursor do mouse. 1.16 Barras de ferramentas Três barras de ferramentas são exibidas na parte superior da OxMetrics, abaixo da barra de menu. As barras de ferramentas podem ser personalizadas a partir de um clique direito na barra. A personalização permite adicionar ou remover ícones e escolher tamanho de ícone pequeno ou grande (o padrão é o padrão). A barra de ferramentas FindReplace, por padrão, na segunda linha, replica a maioria dos comandos da caixa de diálogo FindReplace. Os dois estão ativamente vinculados, e a barra FindReplace geralmente é uma maneira conveniente de pesquisar rapidamente por texto ou executar ações de pesquisa. O layout padrão consiste em: Encontrar texto Especifique o texto a ser procurado. A caixa de lista suspensa contém textos de pesquisa usados ​​anteriormente. Você pode usar um menu de contexto (clique direito) para inserir texto da área de transferência. Localizar para baixo Localiza a próxima ocorrência do texto de busca para baixo a partir da localização atual do cursor. Localizar encontra a próxima ocorrência do texto de busca para cima a partir da localização atual do cursor. Case sensitive Alternar pesquisa sensível a maiúsculas e minúsculas ativada ou desativada (se o botão estiver baixo, a pesquisa é sensível a maiúsculas e minúsculas). Palavra inteira Liga / desliga a palavra (se o botão estiver baixo, a busca só encontrará palavras inteiras). Ir para a próxima instância Encontre a próxima instância do texto selecionado no momento a partir da localização atual. O texto selecionado se tornará o padrão para pesquisas subseqüentes. Ir para instância anterior Localiza a instância anterior do texto selecionado no momento a partir do local atual. O texto selecionado se tornará o padrão para pesquisas subseqüentes. Caixa de diálogo Mostrar pesquisa Abra a caixa de diálogo Localizar. Caixa de diálogo Mostrar substituir Abra a caixa de diálogo Localizar. Localizar em arquivos Abra uma caixa de diálogo que permita procurar seqüências de texto em arquivos de disco. Temas de texto Coluna de edição Uma seleção de coluna pode ser feita com o mouse: selecione com o botão direito do mouse, mantenha a tecla ALT abaixada e selecione com o botão esquerdo do mouse ou com o teclado: mantenha a tecla ALT abaixada e selecione com a tecla Teclas de seta. Uma seleção de coluna pode ser arrastada e descartada: dentro da mesma janela, ela será tratada como uma seleção de coluna, outras janelas não sabem que é uma seleção de coluna, e ela será tratada como uma seleção normal. Use o comando Colar como coluna para inserir texto da área de transferência como uma coluna. Use o comando Classificar para classificar usando uma seleção de coluna. É possível restringir uma operação findreplace a uma seleção de coluna. Margem do texto A margem esquerda indica onde o cursor é: amarelo: texto editable normal vermelho: somente leitura verde: é saída ou janela de entrada do módulo em execução. O duplo clique na margem altera a numeração da linha. No modo binário e hexadecimal, a posição do primeiro caractere é mostrada em hexadecimal. O clique direito na margem define ou limpa um marcador. Marcadores de texto Um marcador permite a navegação rápida através de um documento. Um marcador é mostrado como um pequeno retângulo azul na margem da linha. Para definir um marcador: mouse: clique direito na margem do menu de linha: use ViewSet Marker find: A caixa de diálogo Localizar pode definir marcadores em todas as linhas contendo o texto de pesquisa. Para limpar um marcador: mouse: clique direito na margem da linha se essa linha tiver um menu de marcação: use o menu ViewClear Marker: use ViewClear Todos os marcadores Para ir para um marcador: menu: use SearchGoto Next Marker ou SearchGoto Previous Markker Markers are Não lembrado entre as sessões. Modos de exibição de texto O OxMetrics possui três modos de visualização: Modo texto Este é o modo de visualização padrão para um arquivo de texto. Este modo permite a edição do texto. Modo binário Este é o modo de visualização, mais útil para o arquivo binário. O OxMetrics verifica se um arquivo é binário ao carregá-lo. Se assim for, o modo de visualização é padrão para este modo binário. O indicador de posição na barra de status mostrará a posição do cursor em decimal (o primeiro caractere do documento é no byte 0). No modo binário, não existem linhas de texto. As linhas da tela são determinadas pela largura da janela. Em vez de linhas na margem, a posição do primeiro caractere é mostrada em hexadecimal. Modo Hexadecimal Este é o modo alternativo de visualização binária. A exibição consiste em duas colunas, com o texto à direita e os valores hexadecimais à esquerda. O indicador de posição na barra de status mostrará a posição do cursor em decimal (o primeiro caractere do documento é no byte 0). Caixa de diálogo Agregado Cria um novo banco de dados que contém os dados agregados do banco de dados atual. Novo nome O nome do novo banco de dados. Nova freqüência A nova (menor) freqüência. O novo banco de dados terá uma freqüência fixa se a freqüência for mensal ou inferior. Método de agregação Período final - a última observação em cada período. Período médio - a observação mais próxima do meio de cada período. Se houver observações antes e depois equidistantes, a observação antes do meio é usada. Dia que está mais próximo do dia de quarta-feira mais próximo de 1 de julho. Média - a média do período mensal para o período é ajustada para o período de duração. Soma - a soma para o período de cada semana a mensalidade é ajustada para o período do mês. Pico - o valor mínimo em cada período. Through - o valor máximo em cada período. Álgebra dialogo Álgebra diferencia maiúsculas de minúsculas: CONS e contras referem-se a diferentes variáveis. Os nomes inválidos podem ser usados ​​em Álgebra quando incluídos entre aspas. Mais informações sobre a sintaxe de álgebra e outras formas de executar o código de Álgebra podem ser encontradas aqui. Quando você cria uma nova variável através de uma operação de atribuição, ela é imediatamente adicionada ao banco de dados e inicializada em valores faltantes. Se necessário, o nome do banco de dados será truncado para 64 caracteres. O banco de dados em foco pode ser alternado da caixa drop-down na barra de ferramentas. Campo de edição A caixa de diálogo de álgebra apresenta uma janela de edição padrão, onde os comandos da Algebra podem ser digitados, ou cortar o amplificador colado etc. de outra janela de edição. Esta janela se comporta de forma semelhante à janela Resultados (por exemplo, clicando duas vezes na margem irá alternar a numeração da linha para ligar e desligar). Executar Execute o código de álgebra e sai da caixa de diálogo quando a execução for bem-sucedida. Se ocorrer um erro durante o processamento, a execução será interrompida e uma mensagem de erro será exibida na parte superior da caixa de diálogo. Feito Fecha a caixa de diálogo. Carregar Carrega um arquivo com o código de álgebra do disco. Salvar como Salva o conteúdo da janela de edição da álgebra no disco. Recall Recupera o código de álgebra da execução anterior da caixa de diálogo. Funções Exibe as funções disponíveis na Álgebra. A função selecionada será usada em Write Algebra Code. Banco de dados Mostra o conteúdo do banco de dados. As variáveis ​​selecionadas serão usadas no Código de álgebra de escrita. Ao lado da lista de conteúdos há quatro botões: para excluir variáveis, para mover variáveis ​​para cima, para mover para baixo e para renomear uma variável. Avaliação de sub-amostra Se esta caixa estiver marcada ao escrever o código de álgebra, uma caixa de diálogo adicional aparece para selecionar uma sub-amostra sobre a qual o código de álgebra deve ser executado. Write Álgebra Code Isso pode ser usado para colar o código para a função selecionada e variável (s) para a janela de edição. O código ainda pode exigir alguns ajustes adicionais. Diálogo de lote O OxMetrics suporta um idioma de lote para fácil repetição ou comunicação de operações. Os comandos relacionados à saída de entrada de dados, lote, etc. são tratados pela OxMetrics. Alguns módulos também suportam a linguagem do lote, estendendo os comandos da OxMetrics com os seus próprios. Um exemplo é o PcGive. Se um modelo tiver sido estimado em PcGive, o código será automaticamente registrado na janela do lote. O OxMetrics não conhece os comandos do PcGive, então verifique o sistema de ajuda do PcGive para os comandos do PcGive. Mais informações sobre a sintaxe do lote e outras formas de executar o código do lote podem ser encontradas aqui. Campo de edição A caixa de diálogo do lote apresenta uma janela de edição padrão, onde os comandos de lote podem ser digitados, ou cortar o amplificador colado etc. de outra janela de edição. Por padrão, esta janela conterá o código do lote para o modelo estimado mais recente. Executar Execute o código do lote e sai da caixa de diálogo quando a execução for bem-sucedida. Se ocorrer um erro durante o processamento, a execução será interrompida e uma mensagem de erro será exibida na parte superior da caixa de diálogo. Feito Fecha a caixa de diálogo. Carregar Carrega um arquivo com o código do lote do disco. Salvar como Salva o conteúdo da janela de edição do lote no disco. Recall Recupera o código do lote da execução anterior da caixa de diálogo. Histórico de carga Carrega todo o histórico do código do lote para modelos estimados na janela de edição. Isso pode ser editado para apenas selecionar um modelo específico, salvo no disco ou copiado para a área de transferência. Comandos de lote Esta é uma lista com todos os comandos de lote que são reconhecidos pela OxMetrics. Clicar duas vezes em um comando irá colá-lo para o editor. Caixa de diálogo da calculadora A calculadora permite manipulação fácil das variáveis ​​no banco de dados e é uma maneira conveniente de escrever expressões de álgebra. O objetivo é criar uma expressão de álgebra válida na janela de expressão (sem a atribuição e o ponto-e-ponto de terminação). Todas as transformações bem-sucedidas são registradas na janela de resultados. A caixa na parte superior da caixa de diálogo mostra a expressão atual. A transformação de dados usando a calculadora pode ser escrita diretamente no campo de expressão na parte superior. Em seguida, pressionar o botão pede um nome de destino e executa o código de álgebra. O código está escrito na janela de resultados. Os campos abaixo da janela de expressão podem ajudar a salvar a digitação: selecione uma variável (ou várias variáveis) pressione um botão de função (log, diff, etc.) para colar o código, modifique o código, se necessário, pressione para avaliar fornecer um nome de destino. Suponha que você tenha realçado a variável CONS e pressionado o botão de log. Então a expressão lê log (CONS). Ao pressionar, o logaritmo de CONS será computado. A nova variável deve ser nomeada, com LCONS a sugestão em GiveWin. Aceite isso e LCONS será adicionado ao banco de dados. Se o LCONS já existe, você deve confirmar a substituição da variável existente. Múltiplas operações podem ser realizadas, como A2log (CONS) -3log (INC). Mais informações sobre a sintaxe Álgebra e outras formas de executar o código Algebra podem ser encontradas aqui. Campo de edição O caclulador apresenta um campo de edição padrão, onde os comandos da Algebra podem ser digitados ou criados usando as instalações da calculadora. Banco de dados Mostra o conteúdo do banco de dados. As variáveis ​​selecionadas serão usadas no código gerado. Abaixo da lista de conteúdos há quatro botões: para excluir variáveis, para mover variáveis ​​para cima, para mover para baixo e para renomear uma variável. Funções Exibe as funções disponíveis na Álgebra. Se uma variável estiver realçada (por exemplo, CONS) e você pressiona um botão de função (por exemplo, log), o log de expressões (CONS) será inserido no campo de edição. Log Para assumir o logaritmo (natural) de uma variável. Pode ser aplicado a múltiplas variáveis ​​ao mesmo tempo. Lag Para tomar o n th lag de uma variável, o padrão é o primeiro atraso (o número negativo dá uma vantagem). O OxMetrics acrescenta o comprimento de atraso como caracteres extras em um nome, precedido por um sublinhado. Por exemplo. CONS1 é CONS 1 período atrasado. A primeira observação do CONS1 será os valores em falta. Você é recomendado contra a criação de variáveis ​​atrasadas dessa maneira, uma vez que os atrasos podem ser criados quando um modelo é formulado no PcGive. Esta função pode ser aplicada a várias variáveis ​​ao mesmo tempo. Diff Toma a n ª diferença de uma variável. A função dlog assume a primeira diferença do logaritmo (natural). Esta função pode ser aplicada em múltiplas variáveis ​​ao mesmo tempo. Dlog A função diff leva a nona diferença de uma variável. A função dlog assume a primeira diferença do logaritmo (natural). Esta função pode ser aplicada em múltiplas variáveis ​​ao mesmo tempo. Dummy Para criar um manequim. Um manequim (ou intervenção) é uma variável que consiste em 0 e 1s. Outro Exibe a lista completa de funções de álgebra. Keyboard Prompts para um nome de destino e executa o código de álgebra. - Para respectivamente: poder, multiplicação, divisão, adição, subtração. Estes (e os botões restantes para 0,1.) São colados no campo de edição. C Isso limpa a janela de edição da calculadora. Avaliação de sub-amostra Se esta caixa estiver marcada ao pressionar o botão de avaliação (ou entrar), uma caixa de diálogo adicional aparece para selecionar uma sub-amostra sobre a qual o código de álgebra deve ser executado. Eliminar diálogo (banco de dados) A parte superior da caixa de diálogo mostra a variável (ou variável) selecionada e as observações (ou intervalo de observação). Observe que qualquer exclusão pode ser desfeita novamente. Exclua variáveis ​​inteiras para excluir a (s) variável (s) selecionada (s), ou seja, colunas inteiras. Exclua as observações selecionadas para todas as variáveis ​​(linhas inteiras) para excluir inteiramente as linhas selecionadas. Exclua todas as observações para as quais essa variável tenha valores faltantes para excluir linhas inteiras para as quais a variável atualmente selecionada tenha um valor faltando. Exclua todas as observações para as quais esta variável não é zero ou falta para manter apenas linhas inteiras para as quais a variável atualmente selecionada possui um valor válido não-zero. Remova as observações selecionadas e mude as observações remanescentes para apenas remover as observações das variáveis ​​selecionadas (não as linhas inteiras, de modo que a amostra permaneça inalterada). As observações desocupadas são definidas como valores perdidos. Observe as observações com o valor especificado para definir os valores no bloco selecionado para o novo valor como especificado. A eliminação de observações (linhas inteiras) funciona da seguinte forma. Se o banco de dados tiver uma freqüência fixa, as observações restantes serão movidas para preencher a lacuna, e a amostra será reduzida pelo número de observações excluídas. Para um banco de dados datado, as observações restantes não alterarão suas datas. Tabela de descrição do banco de dados. Esta é uma janela padrão do editor de texto, onde a documentação pode ser digitada, cortar o amplificador colado etc. para registrar detalhes sobre o banco de dados em questão. A descrição só é preservada nos arquivos de dados OxMetrics (. In7. Bn7). Abaixo está o resumo do banco de dados (o mesmo que pode ser impresso na janela de resultados no menu Exibir). Lembre-se de que o diálogo pode ser redimensionado para ver a informação completa. Esta caixa de diálogo também pode ser ativada clicando duas vezes na célula superior esquerda. Alterar caixa de diálogo de amostra Frequência e data de início Ou especifique a freqüência de dados fixa e o início da amostra (ano inicial, período) para definir as características da amostra. Ou faça com que o banco de dados seja datado, selecionando datado e os números de dias por semana. Isso criará as datas de calendário adequadas (ignorando feriados). Alterar a frequência e a data de início não altera o número de observações no banco de dados: o final do ano (período) é ajustado automaticamente. Tamanho da amostra O período de amostra do banco de dados pode ser estendido no início e / ou adicionando qualquer número desejado de observações nesta caixa de diálogo. Também é possível excluir as observações para reduzir o banco de dados. Os dados para o (s) período (s) prolongado (s) são definidos como valor faltando. Descrição variávelRename variável Nova janela de variáveis ​​Ao clicar duas vezes no nome de uma variável na base de dados, é produzida a caixa de diálogo para editar a descrição atual. A variável pode ser renomeada neste campo. Descrição da variável A descrição é preservada apenas nos arquivos de dados OxMetrics (. In7. Bn7). Uma descrição que se aplica ao banco de dados como um todo está disponível na descrição do banco de dados Tipo de variável O tipo de variável é relevante para criar um banco de dados datado. Padrão para uma variável numérica normal. Data para uma variável que contém datas e ou vezes. Escolha para uma variável que possui rótulos de texto associados a valores específicos. Os arquivos Excel que não correspondem exatamente ao formato de dados exigido podem ter tais variáveis. Isso apenas foi preservado corretamente com valores numéricos corretos em arquivos de dados OxMetrics (. In7. Bn7). Apagar diálogo (gráficos) Selecione uma área na coluna esquerda e um objeto gráfico no lado direito. Em seguida, pressione o botão Excluir para excluir e Done para fechar a caixa de diálogo. Qualquer exclusão pode ser desfeita novamente. Observe que texto, legenda, eixos e símbolos individuais (linhas, retângulos, etc.) podem ser selecionados com o mouse e, em seguida, excluídos pressionando a tecla de exclusão. Edit Graph dialog Quase tudo pode ser alterado em um gráfico através da caixa de diálogo Edit Graph ou pelo menu de contexto de um clique com o botão direito do mouse no gráfico. Alternativamente, clique duas vezes para selecionar e editar o objeto selecionado. Mais informações detalhadas sobre os vários aspectos podem ser encontradas aqui. Layout do gráfico Esta seção contém as configurações que se aplicam ao gráfico inteiro. Isso inclui o layout da área, seja para usar caixas, o modo PostScript para usar, etc. Área 1 As entradas restantes no lado esquerdo são as áreas no gráfico. Selecione uma área para editar propriedades específicas para essa área. Isso inclui cores e estilos de linha para cada série plotada, estilo de eixos, legendas, histogramas, barras de erro, etc. Se houver mais de uma área, algumas propriedades podem ser copiadas da área atual para todas as outras áreas. Prperties À esquerda é a lista completa de propriedades que podem ser modificadas. Diálogo de gráficos Esta caixa de diálogo é usada para especificar as variáveis ​​a serem utilizadas no tipo de gráfico selecionado. Depois de criar um gráfico, uma grande variedade de opções estão disponíveis para alterar a maioria dos aspectos. O banco de dados À direita é a lista de todas as variáveis ​​no banco de dados, cuja seleção pode ser marcada para representação gráfica, movendo-as para a lista de seleção. Observe que o banco de dados ativo está listado no título (assim como a área ativa se o gráfico for adicionado a uma área). O banco de dados pode ser alterado a partir da caixa suspensa na barra de ferramentas, ou simplesmente ativando outro banco de dados. Ltlt Move as variáveis ​​de banco de dados selecionadas para a lista de seleção. Gtgt Remove as variáveis ​​selecionadas da caixa de listagem Seleção. Seleção Lista as variáveis ​​que foram selecionadas para representação gráfica. Actual series plots the actual values of the selection in one graph and closes the dialog. Actual series (seperately) plots the actual values of the selection in separate graphs and closes the dialog. Scatter plot (YX) creates a scatter plot of the selection and closes the dialog. The last variable in the selection is the X variable, and if n variables have been selected, n -1 cross-plots will be made. All plot types Moves to the Graphics Wizard to select a type from a wide range of graph types. The Graphics dialog for all plot types has three fields: Plot category Actual series Transformed time series, for logscale, first differences, growth rates and different scales Multiple series Scatter plots Distribution for estimated densities and histograms, freqquency plots, boxplots, etc. QQ plots, etc. Time-series properties for (partial) autocorrelations, periodogram, spectrum, etc. Two series by a third for error barsbands, high-low graphs, etc. 3-D (XYZ) plots for surface and contour plots Sub category provides a visual way to select a sub category. All sub categories and properties provides access to all properties for the selected category. Graphics Text (Add Text) dialog Text can be typed anywhere in a graphics window. Typing any keyboard character brings up this dialog where the desired text can be entered. Text can be also added from the Edit menu using Add Text. Text entered immediately above the graph will have the title property, which means that it is moved with the area when the area is moved. Mathematical and other formatting can be incorporated through LaTeX style commands. Previously typed text can be revised by double clicking on it, an then selecting it in the properties editor moved by grabbing with the mouse or deleted by clicking then pressing the Del key. The following text properties can be changed after double clicking: actual text, type (floating, title, axis label), size, rotation, and location. Model dialog The modelling dialog gives access to all the modelling features of the OxMetrics modules. Whhich modules are available depends on your installation. For example, it may only include STAMP and PcGive, or also PcGets and Grch. Module Determines whether the category and model choices are listed for all modules together, or only for the selected module. Category Lists the available model categories, including models for time-series data, for cross-section data, for panel data, etc. Model Lists the available models for the current category. running icon This icon moves when the module is running. To interrupt in that case, click on it (a dialog will ask for confirmation the subsequent response may not be immediate). Formulate to start model formulation. This will normally follow through to estimation. Estimate To re-estimate the model. Test To access the test menu for the active module. Progress To access the progress dialog. Options To access the options dialog for the active module. FindReplace (text) dialog Allows text to be found or replaced in the current document, current selection or all open documents. C style means that escape characters in the find or replace text are recognized, e. g. n for a new line and t for a tab. Text properties dialog Allows the removal of tab characters, change of end-of-line mode, and the multilingual format. Preferences dialog For persistent options that affect the way OxMetrics operates. Options dialog For persistent options that affect the way OxMetrics operates. Graphics setup dialog This dialog determines the default settings for OxMetrics graphs. These settings are persistent, and will also affect the way graphs from Ox code disappear. Ox code can make modifications to the persistent settings using SetDraw (which is why DrawAdjust is preferred: that applies to the current graph only). The settings can be reset to the initial default, or saved as a batch file that can be run later. Cleaning data in Stata Cleaning data is a rather broad term that applies to the preliminary manipulations on a dataset prior to analysis. It will very often be the first assignment of a research assistant and is the tedious part of any research project that makes us wish we HAD a research assistant. Stata is a good tool for cleaning and manipulating data, regardless of the software you intend to use for analysis. Your first pass at a dataset may involve any or all of the following: Creating a number of smaller subsets based on research criteria Dropping observations Dropping variables Transforming variables Dealing with outliers Creating new variables Moving variables Labeling variables Renaming variables Whether this is your first time cleaning data or you are a seasoned data monkey, you might find some useful tips by reading more. Use the Stata help file . Stata has a built in feature that allows you to access the user manual as well as help files on any given command. Simply type help in the command window, followed by the name of the command you need help with and press the Enter key: Write a do file. Never clean a dataset by blindly entering commands (or worse, clicking buttons). You want to write the commands in a do-file, and then run it. This way, if you make a mistake, you will not have ruined your entire dataset and you will not need to start again from scratch. This is a general advice that applies to any work you do on Stata. Working from do-files lets other people see what you did if you ever need advice, it makes your work reproducible and it allows you to correct small mistakes somewhat painlessly. To start a do-file, click on the icon that looks like a notepad on the top-left corner of your Stata viewer2 . In the preliminary stages of your work, you may feel that a do-file is more hindrance than it is useful. For example, if you are not so familiar with a command, you may prefer to try it first. One simple way to do that and still have discipline about writing do-files is to write your do-file in stages, writing only a few commands before executing them, correcting mistakes as you go. In order to execute a number of commands rather than the whole do-file, simply highlight the ones you want to execute, and click on the Execute Selection (do) icon on the top of your do-file editor, at the far right. As you become more proficient with programming in Stata, you wont need to try out commands anymore, and youll discover the joy of writing a do-file and having it run without a glitch. To run a whole do-file, do not highlight any part of it and click on the Execute Selection (do) icon. You may wonder about the commands clear, set more off and set mem 15000 in the screenshot example. These three commands are administrative commands that are quite useful to have at the beginning of a do-file. The first, clear, is used to clear any previous dataset you may have been working on. The command set more off tells Stata not to pause or display the --more-- message. Finally, the command set mem 15000 increases the memory available to Stata from your computer here we will need it as the size of the data set we downloaded from ltodesigt3 is larger than the 10mb allocated to data by default. One last comment about do files: if you double click a saved do file, it will not open for editing, but rather Stata will run that do-file, which can be a bit annoying To reopen a do-file from a folder without executing the commands in it, right-click on it and select edit rather than open. Always keep a log . Again, this is a general rule of thumb on Stata. Keeping a log means you can go back and look at what you did without having to do it again. Starting a log is just a matter of adding a command at the top of your do-file that tells Stata to log, as well as where you want the log to be saved: log using whateverpathyouwant:pickanameforyourlog. smcl4. replace5 Note how logs are saved under the smcl extension. Do not forget to close your log before starting a new one. The last command on your do-file6 will usually be log close. Save as you go . Computers crash, power goes out, stuff happens. Save your do-files every few minutes as you write them. Saving a do file is done the same way as saving any text editor document: either click on the diskette icon, or press CTRLS: You should also save your dataset as you modify it, but make sure to keep one version of the original dataset, in case you need to start over. The command to save a dataset on Stata is save, followed by the path where you want the dataset to be saved, and the optional command replace. Note how the extension for Stata data is. dta, and also note how the new dataset has a different name from the original7 . Become familiar with your dataset . Datasets come with codebooks. You should know what each variable is, how its coded, how missing values are identified. A good practice is to actually look at the data, so that you understand the structure of the information. To do so, you can click on Data in the top-left corner of your viewer and select Data editor, then Data editor (browse). A new window will open and you can see your data. You can also use the command browse, either by typing it directly in the command window, or from a do file: One of the distinguishing features of ltodesigt is that when you download a dataset, it comes with labels. Variable labels are descriptions of variables, and value labels are used to describe the way variables are coded. Basically, the value label sits on top of the code, so that when you browse, you see what the code means rather than what it is. To make this clearer, lets look at the data with no labels. Look, for example, at the GEOPRV variable. Creating a number of smaller subsets based on research criteria There are many reasons why you may want a smaller subset of your data but the main one is that the bigger the dataset, the harder it is for Stata to manage, which slows down your system. Your goal is to make your dataset as small as possible, while keeping all the relevant information. Your research agenda determines what your final dataset will contain. Lets say you have data on the health habits of Canadians aged 12 and up, but your research question is specific to women of reproductive age living in Ontario8. You clearly dont need to keep the men in your dataset, and you wont need to keep the residents of provinces other than Ontario. Furthermore, you can probably drop women under 15 and over 55 years old. Now, lets look at how you would do that. To drop observations, you need to combine one of two Stata commands (keep or drop) with the if qualifier. Make sure you have saved your original dataset before you get started. The keep command should be used with caution (or avoided altogether) because it will drop all but what you specifically keep. This can be a problem if you are not 100 certain of what you want to keep. The drop command will drop from your dataset what you specifically ask Stata to drop. The if qualifier restricts the scope of the command to those observations for which the value of an expression is true. The syntax for using this qualifier is quite simple: Where command in this case would be, drop and exp is the expression that needs to be true for the drop command to apply9 . Using the example of women of reproductive age in Ontario, the first highlighted line drops men, the second line drops any observation not in Ontario, while the last line drops observations in age groups older or younger than our subset of interest. You have to be careful with logical operators notice the syntax in the third line. A common mistake is to ask Stata to drop if DHHGAGEgt10 amp DHHGAGElt2. There are no individuals in the dataset who are older than 55 AND younger than 15. We want to drop if older than 55 OR younger than 15. Here is a list of operators in expressions. You would mostly use logical and relational operators in conjunction with if: Another way in which you may need to make your dataset smaller is by dropping variables that are not useful to your research. It may be that the information contained in a given variable is duplicated (i. e. another variable provides the same info), or maybe all the observations for a variable are missing, or a variable just happens to be in your dataset but is irrelevant to your research. Dropping variables is very straightforward simply use the drop command. Looking at the data from CCHS, the variable SLP01 (Number of hours spent sleeping per night) is coded as. a (NOT APPLICABLE) for each observation in the dataset. Clearly we will not learn anything from that variable, so we can drop it. The syntax for dropping variable is simple: Where varlist is the list of variables you would like to drop. Its easy to drop a number of a variable at a time this way. Here I am dropping all the variables that were coded as Not Applicable for more than 95 of observations10 : Sometimes variables are not coded the way you want them to be. In this section we will look at two transformations you may need to do on some variables before using them: recode and destring. The recode command changes the values of numeric variables according to the rules specified. In the CCHS dataset, many variables have missing values coded as. a or. d. This is convenient because it will not affect calculations you might do using the data (for example if you calculate an average). However, many datasets use 999 as a missing variable code, and that might be problematic. We might want to recode these as . in order to not have them affect any calculations we plan on doing with the data. The syntax for this command is: recode varlist (old value(s)new value)11 Lets recode the height and BMI variables from the CCHS data, (for the sake of illustration, since its really not necessary in this case): The destring command allows you to convert data saved in the string format (i. e. alphanumeric) into a numerical format. The CCHS dataset does not contain any string variable. In order to see what a string variable looks like, we can use the converse command, tostring, to create a string variable. We will then convert that variable back to a numerical format. A string variable shows up in red in the data editor: Although it may look the same as the variable CIH2, Stata cannot do any calculations on the string variable (since its format is telling Stata that it is made of letters or other symbols). Lets destring it: Notice the use of the options generate and replace. When we created the fake string variable, we used generate because we wanted a new separate variable. Now, when we destring, we are replacing the string variable by its numerical counterpart. How you choose to do this in your own dataset depends on how you plan to use the variables. Will you still have any use for the string variable If so generate a new one when you destring. Do you just want that variable to not be in string format Then replace it with the new one. Here, we can see that our variable string is now completely identical to the variable CIH2: (We can drop that variable now) Outliers deserve their own section because there is often confusion as to what exactly constitutes an outlier. An outlier is NOT an observation with an unusual but possible value for a variable12 rare events do occur. The outliers you should be concerned about are the ones that come from coding error. How do you tell which is which Common sense goes a long way here. First, look at your data using the data editor (browse). Outliers tend to jump at you. If you have a small dataset, you can also tabulate each of your variables: Tabulating a variable will give you a list of all the possible values that variable takes in the dataset. Outliers will be the extreme values. Look at the order of magnitude. Are these values believable If the dataset is very big, however, it may not be practical to stare at all the values a variable can take. In fact, Stata will not tabulate if there are too many different values. You can look at your data in a scatter plot: In the CCHS dataset, caseid is the individual id, while hwtghtm is the height in meters. The graph tells us there are no outliers in this dataset: Another way to look for outliers is to summarize the observations for a variable, using the detailed option: The result window will show the main percentiles of the distribution (including the median 50), the first four moments, as well as the four smallest and four largest observations: Clearly, there are no outliers. Lets imagine for a moment that the 99 percentile of the height distribution includes an observation with 5.2m entered as the height. Is it plausible that there really was a 5.2m woman recorded in this dataset Look at the order of magnitude by which this observation would differ from the second largest. Its almost 50 standard deviations bigger. What should you do with such an observation There are a number of solutions but none is perfect: Drop it from your dataset (drop if hwtghtmgt1.803) Use the if qualifier to exclude it when generating statistics that use the height variable ( command if hwtghtmlt1.803) Ignore it if the height variable is not actually that important in your research and the rest of the variables for this observations are coded just fine There are two main commands you need to know to generate new variables: gen is for the basics, while egen allows you to get pretty fancy. You can combine these with qualifiers such as if or in as well as prefix such as by and bysort14 . For example, say you want to create a variable that tells you whether the women in the dataset have a live-in partner. While there is no sure-fire way to establish that, we will approximate it by assuming that women who indicated their marital status as married or common-law actually live with their spouse or common-law partner: The first line creates the variable livein and assigns it a value of 1 if the value of the marital status variable (dhhgms) is either 1 (married) or 2 (common-law). The second line replaces the missing value code by 0, making the livein variable binary. Now, lets say you would like to create a categorical variable that tells you, by age group, if a woman is below or above average in terms of body mass index (BMI). The first line of command creates a variable (meanbmi) which takes on a unique value for each age group, the average BMI for that age group. The prefix bysort is a combination of by and sort you could equivalently break it into two commands: by DHHGAGE: egen meanbmimean(HWTGBMI) The sort part of the command organizes the observation according to the variable DHHGAGE, from smallest to largest, a step required before doing any action by the variable. Its usually easier to just use bysort. The second and third lines (starting with gen) create a binary variable which equals 0 if an observation has a BMI lower than the average for her age group, and 1 if her BMI is above her age group average. Now that you have created these new variables, it would be nice to make sure that the rules by which you generated them was correct. Ideally, you would like to look at livein (the new variable based on marital status) and dhhgms (the marital status variable). However, its hard to compare two variables unless they are side by side. You can use the order command to move a variable (i. e. move a column of your dataset). When you create a variable, by default it becomes the last column of your dataset. You can move it next to another variable instead: Now if we look at our dataset, we can see compare the new variable to the old and make sure that we coded it properly: Similarly, since our two new variables pertaining to BMI are now the last columns, lets move the original BMI variable to the end of the dataset: It now easy to glance at our new variables: Do you notice the problem on line 8 The variable bmicat should not be coded 1 if the original BMI variable is coded as a missing value. We can fix this with a quick replace: replace bmicat. if hwtgbmi. d Whenever you create a new variable, it is a good idea to label it. Why Having your variables labeled makes it easy for you or anyone else using your dataset to quickly see what each variable represents. You should think of your work as something that people should be able to reproduce. Labeling your variables is a small task that makes it much easier for others to use your data15 . The syntax for labeling variables is as follow: label variable varname label . In our previous example, the command would look like this: Note that you can abbreviate this command to lab var: You may find that you work faster if your variables have names that you recognize at first glance. In most cases this is by no means a necessary task in cleaning data, but if you use data from another country, for example, you may find that the variable names are in a foreign language, making it very hard to remember. The syntax is as easy as can be: rename oldname newname Lets see the final do-file Your do-file may be slightly different from this but it should result in the same final dataset: Lets try running it in one go to see if it works. Do not highlight any command and click on Execute (Do). Note that whenever Stata encounters the command browse a data editor will pop up on your screen. Have a look at your data then close the data editor in order for Stata to continue running the do-file. Lets also take the time to open our logs to see what it looks like and how it could be useful. Finally lets look at our final datasets and make sure it contains all the right variables, in the right format. This concludes our workshop but its only the beginning for you. Learning to use statistical software involves a lot of trial and error, angry googling, and desperately trying to find someone who knows how to write a loop Listed below are a few excellent resources to further your working knowledge of Stata:

No comments:

Post a Comment