Aprenda

Conheça mais sobre os dados abertos, veja as perguntas mais frequentes e entenda alguns dos termos utilizados em um catálogo de dados.

Como começar

No catálogo, os dados estão organizados em diferentes Categorias, de acordo com o assunto de que tratam os dados. A categoria de Resultados Educacionais, por exemplo, reúne os dados de IDESP e SARESP.

Dentro das Categorias, os dados estão agrupados por assunto em Conjuntos de Dados. Na categoria de Resultados Educacionais, por exemplo, o conjunto IDESP reúne todos os arquivos relacionados a este indicador.

Os dados também estão organizados por etiquetas (ou palavras-chave) relacionadas ao conteúdo a que se refere o dado. Cada conjunto de dados pode possuir uma ou mais etiquetas, auxiliando na busca pela informação desejada.

Você pode ainda organizar o conjunto de dados por formato, como arquivos "csv" ou "pdf". Isso é útil se você procura por um tipo específico de arquivo.

Em caso de dúvidas, acesse a nossa lista de Perguntas Frequentes e o nosso Glossário.

Análise de dados com R

R é um ambiente computacional e uma linguagem de programação que vem progressivamente se especializando em manipulação, análise e visualização gráfica de dados. Na atualidade, é considerado o melhor ambiente computacional para essa finalidade. O ambiente está disponível para diferentes sistemas operacionais: Unix/Linux, Mac e Windows.

A linguagem R é largamente usada entre estatísticos e analistas de dados para desenvolver softwares de estatística e análise de dados.

Com o intuito de facilitar a análise de dados dos usuários deste Portal, disponibilizamos, nos links abaixo, um tutorial trazendo um exemplo de utilização do R e o script utilizado nesta análise.

list_alt
Baixar arquivo
Tutorial da Análise
code
Baixar arquivo
Código-fonte em R

Perguntas frequentes

A lista de conjuntos de dados encontra-se disponível na seção Dados do portal. Nos tipos de conteúdo, no menu à esquerda da tela, selecione "conjuntos de dados". Se desejar visualizar todos os arquivos disponíveis, independente da categorização, selecione "Arquivo". Para mais informações sobre como navegar pelo conteúdo do portal, acesse a seção Aprenda.
Ao se deparar com um erro nos bancos de dados, solicitamos encarecidamente para que entre em contato conosco pelo Portal de Atendimento da Educação e providenciaremos a correção o mais breve possível. As instruções encontram-se na página de contato Contato.
A participação é uma das premissas da política de governo aberto da Secretaria da Educação. Você pode participar utilizando os dados do portal, participando dos futuros eventos de integração da iniciativa de governo aberto e compartilhando aplicações e estudos desenvolvidos a partir de dados do portal.

Em breve, contaremos com uma seção exclusiva para publicação deste conteúdo em nosso portal.
Os conjuntos de dados disponíveis no portal são públicos e disponibilizados sob licença aberta que permita sua livre utilização, consumo ou cruzamento, limitando-se a creditar a autoria ou a fonte. Acesse nossos Termos de Uso para saber mais.
A publicação de dados no portal segue o Plano de Abertura de Dados Abertos (PDA) da Secretaria da Educação, que estabelece um cronograma de abertura de dados ao longo do biênio 2018-2019. O PDA está sendo desenvolvido pela CIMA e estará disponível em breve na seção Sobre do portal.
A solicitação de informações que não constam no portal de dados da educação é um direito do cidadão e pode ser feita a partir da seção Contato do portal, no link Portal de Atendimento. Para cadastrar um pedido de dados, você deve se cadastrar no portal, clicando no botão "Entrar" e utilizando a opção "Responsável, outras vezes ou comunidade".

Uma vez cadastrado, você clicar no botão ocorrência e abrir uma nova ocorrência, utilizando a opção "Dado". Para maiores informações, acesse o tutorial do portal de atendimento.
Da mesma forma explicada na pergunta anterior, você pode solicitar informações adicionais pelo Portal de Atendimento.
Como está explicado na seção Sobre do portal, informações como nome, documentos de identificação, endereço residencial e telefone são considerados informações pessoais e não constam em nosso catálogo de dados.

Consideramos a garantia do direito à privacidade como fundamental. Caso você seja aluno, pai ou responsável e deseja informações sobre vida escolar, procure a unidade de ensino onde está matriculado.
A disponibilização de informações pessoais para o objetivo de pesquisas científicas está condicionado a uma análise interna da Secretaria acerca da relevância da pesquisa e seu interesse público, conforme está disposto na legislação de proteção de informações pessoais.

Os pedidos devem ser feitos a partir da seção Contato do portal, no link do Portal de Atendimento e serão analisados caso a caso pela CIMA.
Se eventualmente ocorrer um erro que disponibilize informações pesssoais, solicitamos que nos informe por meio do link no Contato e faremos a exclusão do dado imediatamente.
Os Comma-separated values (ou CSV) são arquivos simples, cujos dados encontram-se separados apenas por vírgulas e quebras de linhas. Geralmente, são utilizados para armazenamento de grandes fontes de informação, como bancos de dados com muitas linhas e colunas.

Esses arquivos são bastante versáteis pois utilizam pouco espaço de armazenamento e são compatíveis com quase todos os programas de planilhas eletrônicas.

Para importar ou exportar um arquivo .csv no Microsoft Excel, sugerimos acessar a página "Importar ou exportar arquivos de texto (.txt ou .csv)", disponível no site de Ajuda da Microsoft Office.

Para importar ou exportar um arquivo .csv no LibreOffice Calc, sugerimos acessar a página "Importar e exportar arquivos CSV", disponível no site de Ajuda do LibreOffice.

Glossário

Uma API (Application Programming Interface) permite que produtos ou serviços de dados falem com outros produtos ou serviços.
Um arquivo de dados que não contém links para outros arquivos.
Um conjunto de dados é uma coleção organizada de dados. A representação mais básica de um conjunto de dados é uma tabela. Cada coluna da tabela representa uma variável específica. Cada linha corresponde a um determinado valor da variável dessa coluna.
O arquivo CSV (Comma Separated Values) é um arquivo de texto simples que armazena planilhas ou informações básicas de tabela em um formato muito simples.
Fatos e estatísticas agrupados para referência ou análise.
ETL, do inglês Extract Transform Load, são funções de banco de dados que se combinam em uma ferramenta para extrair dados de diversos sistemas, transformá-los conforme regras de negócio e carregá-los em uma nova base de dados.
Uma maneira de restringir uma pesquisa usando condições específicas.
Usado para indicar dados que possuem um componente geográfico. Isso significa que os registros em um conjunto de dados têm informações de localização, como coordenadas, endereço, cidade ou CEP.
GIS, do inglês Geographic Information System, é um sistema projetado para capturar, armazenar, manipular e apresentar todos os tipos de dados geográficos.
Metadados são dados que descrevem dados. Os metadados podem descrever como os dados são representados, os intervalos de valores aceitáveis e seu relacionamento com outros dados. Os metadados também podem fornecer outras informações relevantes, como a pessoa responsável por ele, leis e regulamentos associados e a política de gerenciamento de acesso.
O Sistema de Origem, ou Sistema de Registro, é o sistema de armazenamento de informações que é a fonte de dados autoritativa para um determinado elemento de dados ou parte da informação.
SQL, do inglês Structured Query Language, é a linguagem de pesquisa padrão para bancos de dados relacionais responsável por consultar e editar informações armazenadas em um determinado sistema de gerenciamento de banco de dados.