Novo Querido Diário: rumos e meios para chegar lá!

Queridas e queridos,

Sou novo nesse fórum, meu nome é Cuducos, sou um dos fundadores da Operação Serenata de Amor.

A Open Knowledge Brasil, e o seu Programa de Ciência de Dados para Inovação Cívica (do qual o tima da Serenata faz parte), começou mais uma iniciativa de mexer com os diários oficiais, com o intuíto de trazer a Rosie para a esfera municipal. O repositório ainda chama diario-oficial, mas internamente temos chamado de Querido Diário para homenagear e sugerir uma continuação do projeto homônimo de uns anos atrás.

Eu estava falando com o @rennerocha hoje e ele me deu um toque de que as coisas parecem largadas. Em parte é verdade: estamos tocando uns três projetos em paralelo e nos falta braço. Mas em parte também é falta de um espaço para falarmos sobre o projeto. Então vim aqui puxar esse papo, criar esse espaço.

Como dito no nosso Guia de contribuição a meta é chegar às 100 maiores cidades do Brasil com raspadores de dados (Spiders na jargão do Scrapy) e, em paralelo, estruturar dados sobre dispensa de licitação: é o que fazem os parsers (no jargão do projeto). Fizemos parsers para Porto Alegre e Goiânia e, na medida que tivermos mais parsers, a ideia é treinar um algoritmo que consiga extender isso a mais cidades.

Ainda temos uma bolsa da Mozilla para nos forcarmos em NLP e textos oficiais em português, o que pode facilitar a exploração desses diários, e abrir outras portas.

Para não virar textão paro por aqui. Mas abro o espaço para falarmos sobre essas ideias, esses códigos e esse projeto :heart:

8 Likes

Olá, @cuducos!
Seja bem vindo por aqui.

Sou um apoiador e um admirador do trabalho do Serenata desde o início. O projeto Querido Diário vem preencher uma lacuna importante que é o pouco acesso que se tem aos diários oficiais da maior parte dos governos locais, ainda mais quando se fala em acesso automatizável por máquina.

Recomendo fortemente a quem for contribuir com o projeto que conheça e faça uso dos padrões do projeto LexML para, por exemplo, estabelecer identificadores únicos para cada ato oficial publicado nos diários, para estruturar os textos em seus elementos constituintes (ex.: capítulos, artigos, incisos, etc.), para identificar a autoridade que publica o ato, etc. O projeto se baseou nas melhores experiências internacionais sobre o assunto, tais como o MetaLex e o Akoma Ntoso. O @ppkrauss participa da Open Knowledge, frequenta este fórum e é outro grande conhecedor que acompanha de longa data o projeto LexML.

É muito bom vocês terem conseguido essa bolsa da Mozilla para o projeto. Não posso concorrer a bolsa até porque estou sem tempo para me comprometer com o projeto, mas posso ocasionalmente ajudar com algum trabalho, já que a minha pesquisa de mestrado (dissertação, apresentação) envolveu justamente NLP em textos oficiais em português. Também já fiz bastante raspagem. Enfim, tenho bastante apreço por este projeto, espero ter condições de ajudar de alguma forma e recomendo a quem se interessar por qualquer desses assuntos que participe!

2 Likes

Oi, eu trabalhei por um tempinho com o QueriDO do João Meireles, que tinha uma concentração mais pra curadoria, mas logo mudei meu foco pro trazDia, do Andrés Martano, que tinha um objetivo bem parecido com essa nova iniciativa.
Eu estive estudando o teu repositório e, como tudo que vocês fazem, fiquei impressionado com a qualidade da estrutura. Rodei ele no meu computador sem muitos problemas, o que também indica boa documentação. Ou seja, tem tudo que precisa pra ganhar tração.
Queria que isso tivesse acontecido 1 ano atráz, quando eu estava ainda aí no Brasil :frowning: Mas se pá ainda posso ajudar, por que acredito muito no benefício que isso traria.
Vou continuar estudando o código, e vou ver se consigo pegar uma ou duas issues pra trabalhar em breve. Enquanto isso, desejo sucesso.

2 Likes

Por sinal, segue aqui link pra uma outra discussao relacionada aos diarios:
https://discuss.okfn.org/t/dados-do-diario-oficial-da-uniao-serao-publicados-em-formato-aberto/4027/3

O que podemos fazer para dar um quebra na hegemonia depreciativa nas redes sociovirtuais? Não há um uso saudável? fora das redes para trabalho nas mídias? De dados x, y, z, enviamos um “eu confio em você”, seja para uma próxima, entrevista de trabalho, ou pedido de casamento, virtual. Os que se veem perdidos no meio da falsidade virtual, ou são imensamente depreciativos não só no mundo virtual, ou beiram a loucura, e buscam a saída, para dentro, pela meditação.

Sobre o uso de dados virtuais para o bem imagino que temos que pensar sim no sentido de transcender a moral para como Übermensch, à graves problemas mentais vindo ao uso indiscriminado e viciante das redes sociais, que nos cegam, e se depoimentos sobre Jesus na goiabeira dentro de igrejas, que alcançam poucas milhares de pessoas já nos deixam perplexo e cegos para os graves problemas econômicos e ambientais ( aqui digo também de nossa espécie) de nossa era, o que fazem as redes sociais que consomem as vezes quase uma dezena de horas de jovens, em todo mundo, como faremos para que tornem-se saudável, e prática, a vinda das informações que queremos ter. Disse Chico Xavier sobre pós a Data Limite de 2019 e o que seria de nossas informações, obviamente pelos meios digitais: “…o homem terrestre terá amplo e total acesso à informação e à cultura, que se fará mais generalizada”. Qual é a influência que queremos alcançar sobre tais ditos? Quais serão nossos rumos e meios para chegar lá?.

Estou a construir um projeto de lei que possibilite a supervisão dos gastos públicos feitos por escolas principalmente, (mas que gostaria de agregar à projetos como a Operação Serenata De Amor, disponibilizando para secundaristas estarem ligados no quanto chega, no quanto saí, e no quanto se gasta por ano com “biscoitos sortidos para sala dos supervisores”, enquanto falta-nos papel higiênico em banheiros, cestas de basquete em quadras, em diversas escolas espalhadas pelo Brasil), onde os secundaristas interessados entrariam em contato com os projetos por iniciativas produzidas pelos seus grêmios escolares, que através dos PC’s (quando as escolas possuem) montam cartazes com balancetes mensais de gastos escolares, e 1 vez a cada 2 bimestres um projeto para aprimoramento dos gastos. O projeto de lei teria intuito de oficializar este direito de fiscalização e facilitar através das ferramentas produzidas por vocês.

@Pateus, já existem diversos projetos de lei em tramitação na Câmara dos Deputados que tratam de transparência pública e dados abertos. Não seria o caso de avaliar e procurar um parlamentar para propor uma emenda, se necessário, para atender a essa necessidade? Uma compilação dos projetos de lei com essa temática pode ser encontrada aqui:

@cuducos, na semana passada o plenário da Câmara dos Deputados aprovou regime de urgência para o PL 7.843/2017, que agora está pronto para pauta no plenário. Acha que seria pertinente propor alguma emenda que facilitaria o projeto Querido Diário, algo no sentido de estabelecer uma obrigação que os diários oficiais tenham que ser disponibilizados na internet, em formato aberto e legível por máquina?

@cuducos, é verdade que na terça feira (10) haverá uma live sobre o Querido Diário? Poderia passar mais informações?

Não sei. Eu saí das operações da OK em fevereiro e essa semana foi especialmente corrida e não acompanhei as redes sociais. Sabe de algo, @Fernanda_Campagnucci?

Recebi um e-mail da newsletter da Serenata dizendo que haverá a live amanhã, mas ainda não passaram o link. Respondi o e-mail dizendo que seria legal se respondessem aqui, para que ficassem sabendo também as pessoas que não recebem a newsletter.

A live do Querido Diário foi ontem, mas infelizmente não pude participar no horário. Poderia nos contar um pouco sobre como foi, @Fernanda_Campagnucci?

Olá, @herrmann

Sim, aconteceu ontem à noite e está registrado na íntegra aqui:

Parte 1 - Projeto Embaixadoras - Querido Diário: Do PDF aos dados abertos de diários oficiais - YouTube
Parte 2 - Projeto Embaixadoras - Querido Diário: Do PDF aos dados abertos de diários oficiais - Parte 2 - YouTube

(em duas partes porque tivemos uma interrupção da transmissão)

Participaram dois colaboradores do projeto, o Giovani e a Ana Paula, que falaram sobre os desafios técnicos do projeto e como começar a contribuir.

PS - as lives do Programa Embaixadoras são mensais e temos divulgado nas redes! Depois fazemos um post para registrar no site da OK, também. Queremos fazer a próxima em meados de janeiro, sobre o Open Data Day 2020! Vou passar a postar aqui para registrar.

1 Like

Está rolando agora mais uma live do Querido Diário!

1 Like

Pessoal,
Por volta da 1h16m vocês falam sobre a diferença de termos de DISPENSA e INEXIGIBILIDADE. Na realidade são termos que juridicamente tratam de casos diferentes, não é uma mera diferença de termos para o mesmo caso. Na 8.666/93, a dispensa é tratada no Artigo 24 e a inexibilidade no Artigo 25. Mas, claro, ambos podem ser utilizados como desculpa para irregularidades.

abraços,

2 Likes