Curso de Especialização em Análise de Dados e Visualização da Informação

Curso de Especialização em Análise de Dados e Visualização da Informação

No início do mês abriram inscrições para o curso de especialização em Análise de Dados e Visualização de Informação na NOVA FCSH. Pandemia, eleições, Ronaldo, desinformação, Cristina, lista de séries e filmes. Não importa o tema, se você precisa coletar dados, analisar informações e comunicar descobertas, não há curso mais oportuno do que este.

O curso terá 4 unidades curriculares: Entrevistando Bases de Dados, Fundamentos da Visualização, Introdução a ferramentas para análise de dados e visualização da informação e Projeto de Dados Acompanhado.

Coordenado por Paulo Nuno Vicente, as aulas serão ministradas por mim, pela Ana Figueiras e convidados. As candidaturas vão até 30 de novembro.

DGS, divulgue os dados

Em 29 de maio foi publicado um artigo de opinião meu no jornal português Público: “DGS, divulgue os dados“. O texto aborda a opacidade da DGS na divulgação de dados sobre os doentes com covid-19 e como isso cria a ilusão (repetida por autoridades) de que o SARS-COV-2 é “um vírus democrático”. Segue um trecho:

As informações sobre os infectados pelo novo coronavírus disponibilizadas por diversos países mostram que factores sociodemográficos alteram o risco da doença. Talvez em Portugal seja diferente e aqui nenhuma classe social, minorias étnicas ou raciais estejam a ser desproporcionalmente afectadas. Mas não temos como verificar porque a Direcção-Geral da Saúde não divulga dados sociodemográficos nos seus boletins epidemiológicos.

A covid-19 nas capas do Correio da Manhã

Coronavírus nas capas do CM

O Correio da Manhã (CM) é, de longe, o jornal mais lido em Portugal e a primeira chamada sobre a covid-19 na capa do CM foi em 26 de janeiro: “Primeiro caso suspeito chega a Portugal“. A suspeita foi descartada dias depois. O tema voltou a estampar a capa do generalista no dia 31: “Netos de Marcelo escapam ao vírus da China“. Entretanto, apenas em 26 de fevereiro, um mês após a 1ª chamada na capa, o CM dedica a manchete ao novo coronavírus: “Mais de 80 mil infetados com vírus da China“. E desde 9 de março o tema é o principal destaque do jornal. Abaixo, as capas desde 26 de janeiro até 04 de março.

Capas do CM em 2020

A covid-19 e o jornalismo guiado por dados

Em 28 de abril, foi publicado um artigo de opinião meu no jornal português Público: “A covid-19 e o jornalismo guiado por dados“. O texto aborda a cobertura da pandemia e discute se esta pode, ou não, representar um momento de viragem no jornalismo guiado por dados em Portugal. Segue um trecho:

Boas visualizações de dados contam histórias complexas de forma simples e clara, sem nunca descurar do cumprimento rigoroso da apuração. São projetos mais demorados para produzir e que exigem profissionais com diferentes aptidões: investigação, estatística, programação, design. Infelizmente, praticamente nenhuma redação portuguesa tem uma equipe dedicada ao jornalismo guiado por dados (data-driven journalism). A falta de capital e a crise crônica que assola o setor é apenas parte da razão. A ausência de disciplinas sobre o tema nas licenciaturas das universidades portuguesas é outro fator determinante.

Visualizações de dados sobre a covid-19

Lista com gráficos, visualizações e mapas interessantes sobre a pandemia de covid-19. Em atualização (última modificação em 27 de Abril).

What we can learn from the countries winning the coronavirus fight | ABC NEWS

Esta peça traz uma excelente introdução explicando como ler alguns dos gráficos mais utilizados durante essa pandemia. Em seguida, analisa o que países como Cingapura e República da Coreia fizeram para “achatar a curva” e o que correu mal em Itália e Estados Unidos. Em outro trabalho, ABC contextualiza a importância da taxa de crescimento de casos de um dia para o outro e mostra o atual variação em diversos países.  

Coronavirus: A visual guide to the world in lockdown | BBC News

Consequências das medidas restritivas ao redor do mundo são apresentadas em uma série de gráficos. A BBC também tem páginas dedicadas ao impacto da doença no Reino Unido e no mundo.

Coronavirus: A visual guide to the world in lockdown | BBC News

La carrera por aplanar la curva: del éxito de Corea al indicador italiano | El Confidencial

Após uma contextualização sobre a evolução da curva de novos casos na Espanha e em outras localidades com muitos infectados, este especial traz um infográfico interativo em que é possível comparar a curva da Espanha com a de outros países. O Estadão, a FSP e o NYT são alguns dos veículos que também desenvolveram ferramentas interativas para comparar a evolução nos casos de covid-19. El Confidencial tem outro especial mais focado nos casos espanhóis. Mas sobre o impacto do coronavírus na Espanha, este trabalho do El País é bem mais completo.

Si alguna autonomía adelanta la desescalada, que esté preparada para testar y rastrear | El País

Análise da evolução da epidemia nas comunidades autônomas da Espanha. É possível utilizar diferentes variáveis para comparar as regiões, entre elas o R0 (número básico de reprodução) de mortos e de casos. Falando em R0, há trabalhos do próprio El País e do Estadão explicando esse conceito. 

Monitor do novo coronavírus nos Estados | Estadão

Nessa página temos (1) detalhes sobre a evolução da curva de novos casos em cada estado do Brasil e (2) e um compêndio com as curvas de todos os estados do país.O Estadão também produziu uma peça focada nas microrregiões do Brasil.

Coronavirus tracked: the latest figures as the pandemic spreads | Financial Times

Os gráficos do John Burn-Murdoch com a evolução das mortes e com casos da doença são já um clássico, inspirando outros veículos e sendo discutido fervorosamente nas redes sociais. A página já é a mais acessada da história do FT e segue sendo atualizada com novos gráficos, permitindo outras leituras dos dados. Por exemplo, um streamgraph foi adicionado recentemente.

Coronavírus no Brasil | Lagom Data

Monitoramento da situação da pandemia do novo coronavírus no Brasil. Destaque para os mapas com dados dos municípios. O G1 produziu uma linha do tempo com os casos confirmados em cada cidade do país. Falando em dados dos municípios, o Brasil.IO disponibiliza dados atualizados com os casos e óbitos confirmados pelas secretarias estaduais de saúde.

 

Consulte o risco de contágio do coronavírus na sua profissão | O Globo

Esta peça interativa mostra quem são os trabalhadores que correm mais risco de contágio por conta das funções que executam. É possível filtrar por área de atuação e pesquisa o índice de risco de contágio em mais de 2500 atividades profissionais.

Portugal a meio gás. O que mudou num país suspenso | Público

Este especial interativo mostra como o estado de emergência (decretado em 18 de março devido à pandemia provocada pelo novo coronavírus) impactou diferentes setores em Portugal. Em uma abordagem parecida, o NYT explorou como a covid-19 mudou a forma como os americanos gastam e navegam na Internet, enquanto o FT mostrou os efeitos na economia mundial. A Google, por sua vez, lançou um relatório com dados sobre o impacto da pandemia de covid-19 na mobilidade e nos hábitos de usuários da empresa em 130 países. Em outras peças interativas, o Público mostra o risco de infecção e a evolução da doença por conselho.

Breaking the wave | Reuters

Após uma introdução explicando como ler os gráficos da peça, a Reuters apresenta a ‘onda’ de mortes em dezenas de países afetados pela covid-19. Em outro trabalho, a agência de notícias explica como uma única pessoa (possivelmente) transmitiu o vírus para cerca de 80% de todos os infectados na República da Coreia. E ainda: como a região da Lombardia, na Itália, foi brutalmente atingida pelo coronavírus.

Breaking the wave | Reuters

Tracking covid-19 excess deaths across countries | The Economist

Há muitas incertezas sobre o novo coronavírus. O real número de vítimas é uma. Muitas vezes a confirmação da causa da morte só ocorre dias depois. Por isso, The Economist resolveu acompanhar o “excesso de mortalidade” em alguns locais severamente atingidos pela covid-19. James Tozer explica melhor. NYT, FT e WPost também desenvolveram visualizações para acompanhar essa discrepância.

How the Virus Got Out | The New York Times

Especial do NYT explicando como a covid-19 se espalhou pela China e pelo mundo ainda em Janeiro. Em outra peça, o jornal mostra a subida vertiginosa de mortos na cidade de Nova Iorque no último mês. Há ainda visualização interativa da evolução da pandemia por região metropolitana nos Estados Unidos.

Why outbreaks like coronavirus spread exponentially, and how to “flatten the curve” | The Washington Post

O ritmo de contaminação por coronavírus é apresentado em 4 diferentes simulações nesse especial. Em menos de uma semana essa página se tornou a mais acessada na história do jornal. Após esse trabalho, Kevin Simler criou várias simulações interativas que ajudam a compreender como uma epidemia se desenvolve. A cobertura do WPost sobre o impacto da covid-19 nos Estados Unidos também é muito recomendável.

Why outbreaks like coronavirus spread exponentially, and how to “flatten the curve” | The Washington Post

Wie das Coronavirus nach Deutschland kam | ZEIT ONLINE

Essa peça mostra que, embora os primeiros casos de infectados com o Sars CoV-2 tenham ocorridos ainda em janeiro, é logo após o carnaval, no distrito de Heisnberg (que ficou conhecida como a “Wuhan da Alemanha”), que o número de casos explode na Alemanha. Há também uma página com a situação atual no país. Der Tagesspiegel também produziu um ótimo especial.

Wie das Coronavirus nach Deutschland kam | ZIET ONLINE

Por fim, Datawrapper e o Flourish estão criando visualizações sobre a covid-19 e Benjamin Ooghe-Tabanou, do Sciences Po médialab, desenvolveu um dos melhores dashboards para acompanhar o tema.

Curso ‘Introdução ao jornalismo de dados’

De 6 a 17 de janeiro ministro o curso “Introdução ao jornalismo de dados” na FCSH, em Lisboa. Inscrições até 13 de dezembro. Mais informações aqui. Segue a descrição do curso:

O jornalismo vive em crise, com receitas cada vez menores e redações mais enxutas. Entretanto, reportagens guiadas por dados ganharam muito destaque nos últimos anos com websites e prémios dedicados a esse conteúdo. Redações ao redor do mundo estão investindo em equipes dedicadas ao jornalismo de dados. Este curso introdutório irá explorar bases de dados em Portugal e no estrangeiro; mostrar como coletar e navegar em grandes conjuntos de dados; como utilizar folhas de cálculo para analisar os dados; e como escolher a visualização/gráfico mais recomendável para o que se pretende comunicar. Também vamos apresentar um conjunto de ferramentas gratuitas para coleta e visualização de peças guiadas por dados da maneira mais eficiente.

5 peças de jornalismo de dados com resultados das eleições legislativas portuguesas de 2019

Rádio Renascença: Quem são os deputados eleitos para a Assembleia da República.

Expresso: Vitórias, derrotas e maus sinais: 11 gráficos para discutir as eleições com os amigos.

Público: Os mapas que mostram o sufoco do PSD, o declínio do CDS e a luta entre BE e PCP.

Rádio Renascença: A freguesia mentalista, o “partido da Rede Expressos”, coisas do tempo da outra senhora e liberais da Estrela.

Jornal de Negócios: Como mudou o Parlamento de 1975 a 2019.

Once Upon a Time in a Land Far Away: Guidelines for Spatio-Temporal Narrative Visualization

Paper apresentado na 23rd International Conference Information Visualisation (IV)

Já está disponível o artigo que escrevi com a Sara Rodrigues e a Ana Figueiras sobre como criar melhores histórias interativas: Once Upon a Time in a Land Far Away: Guidelines for Spatio-Temporal Narrative Visualization.

Jones-Rooy e o ceticismo em relação aos dados

Na era do anti-intelectualismo, notícias falsas, fatos alternativos e pseudociência, estou muito relutante em dizer qualquer coisa. Às vezes parece que nós, cientistas, mal nos aguentamos como estamos. Mas acredito que a utilidade dos dados e da ciência não vêm do fato de serem perfeitos e completos, mas do fato de reconhecermos as limitações de nossos esforços. Assim como queremos analisar as coisas cuidadosamente com estatísticas e algoritmos, também precisamos fazer a coleta de dados cuidadosamente. Somos tão fortes quanto nossa humildade e consciência de nossas limitações.

Trecho da tradução que Natália Mazotte, da Escola de Dados, fez do artigo ‘I’m a data scientist who is skeptical about data‘ da professora de Ciência de Dados na NYU Andrea Jones-Rooy.

Curso online gratuito de introdução ao jornalismo de dados

Começou nesta segunda-feira (05) o novo curso gratuito de jornalismo de dados realizado pelo Centro Knight. Ainda é possível inscrever-se aqui. Segue o programa do curso que vai até 08 de setembro:

A 1ª semana é uma introdução ao jornalismo de dados, sua história e conceitos introdutórios.
Na 2ª semana, os instrutores vão ensinar sobre os tipos mais comuns de dados, além de como configurá-los e analisá-los.
Na 3ª, os alunos aprenderão técnicas simples de raspagem e limpeza.
A 4ª semana é uma introdução à visualização e mostrará como usá-lo para explorar e apresentar suas descobertas.
A 5ª semana introduz noções básicas da linguagem de programação SQL para lidar com grandes quantidades de dados.