Não sou adepto às newsletters, nunca criei o hábito de consumir os e-mails de conteúdo, e menos ainda do Substack, porém muita gente insiste em enterrar seus conteúdos nessa plataforma desnecessária.
Para a minha sorte o Substack (ainda) disponibiliza feeds RSS. Eles ficam no endereço “/feed” da página, como em algumapagina.substack.com/feed ou www.algumapagina.com.br/feed.
Você pode cadastrá-lo no leitor RSS de sua preferência!
Só existe um problema bem chato: o feed é o mesmo para os conteúdos pagos e grátis, que acaba poluído. Não há indicação que o conteúdo é pago, exceto um corte abrupto no texto que você já começou a ler, que se encerra com um link de “Read more”.
Isso não tira o valor do conteúdo grátis, que nem sempre você tem interesse em pagar para receber mais, mas afeta muito a experiência.
É aí que entra o Miniflux, um agregador de feeds RSS poderoso — e que apoiadores do Manual do Usuário tem acesso via PC do Manual, o que eu recomendo muito!
Uma das suas funcionalidades é filtrar conteúdos com regras de “permitir” (mantém apenas os correspondentes) ou “bloquear” (ignora todos os correspondentes).
Elas funcionam com expressões regulares, as famosas RegEx, e se aplicam à postagem assim que houver qualquer correspondência com a regra configurada.
Uma regra que busca apenas por Read more seria ampla demais. Para o caso do Substack, quero apenas as postagens que terminem com este texto, e então, gerei a seguinte regra:
EntryContent=(Read\smore)$
Porém, não funcionou. Avaliando o conteúdo puro do RSS, percebi que após o texto existem as tags que fecham o HTML, e em uma segunda iteração, também descobri que há algum número de espaços entre essas tags.
Com isso, atualizei a regra para:
EntryContent=(Read\smore\s*<\/a>\s*<\/p>\s*)$
As regras se aplicam apenas a novas postagens. Infelizmente para testes é necessário recriar o feed, cadastrando a regra desde o primeiro momento. Não é uma experiência legal, mas quando funciona é bem gratificante!
A regra acima pode ser colocada em cada feed no campo “Entry Blocking Rules”. Ou, pensando bem, ela é bem específica, então você pode também colocar diretamente nas configurações gerais do Miniflux.
Outro filtro que eu uso é para sites que possuem conteúdos que não são notícias, como ofertas (em um volume bem incômodo, diga-se de passagem).
No caso específico, utilizam a estrutura site.com/noticias/xxx e site.com/ofertas/xxx. Com base nisso, tenho a seguinte regra de bloqueio:
EntryURL=\/ofertas|publi\/.+
Meu texto estava ficando desnecessariamente grande (ou ficou), mas acho que consegui manter tanto a parte interessante quanto a informativa.
Tive algumas dificuldades com a documentação super enxuta do Miniflux, e quase sem chances de encontrar outras pessoas falando sobre o mesmo assunto, assim como RegEx sempre parece complicado. Então ficarei feliz em ajudar com qualquer complemento ou dúvida sobre o assunto!
Pra finalizar, agradeço ao Renan, que mantém o PC do Manual junto ao Ghedin, por atualizar a versão do Miniflux! A funcionalidade de filtrar conteúdo em regras individuais por feed foi lançada no último mês, e foi uma grande coincidência eu buscar por isso bem agora.
9 comentários
Sou como você, e até tive o aplicativo do Substack instalado no meu tablet durante um tempo justamente porque gostava de consumir as newsletters como se fossem um feed de um blog. Já assinei algumas por RSS, mas nem todas funcionam, não sei se há alguma configuração que habilita ou desabilita a feed por parte do escritor, mas já teve alguns casos onde simplesmente não consegui assinar por RSS, por isso acabei indo pro aplicativo.
opa, muito obrigado pela dicas, tem um certo Tecnologia Blog que vive com achados, eu acabava pegando palavras e bloqueando manualmente, o que é bem chatinho, pois sempre que mudavam algo, surgia pra mim e aí eu tinha que alterar e bloquear
Ohh, bem lembrado! Também tem os “responde” escritos para o Google.
Uma dica que eu também gostaria de passar pra quem acompanha o YouTube pelo RSS, independentemente do cliente de RSS, e não quer ver os shorts é alterar o
channel_idcomplaylist_ide substituir o prefixo UC por UULF. Assim é gerado um feed sem os shorts.-https://www.youtube.com/feeds/videos.xml?channel_id=UCabcdefgh+https://www.youtube.com/feeds/videos.xml?playlist_id=UULFabcdefghFeed original:
https://www.youtube.com/feeds/videos.xml?channel_id=UCcOkA2Xmk1valTOWSyKyp4gFeed com as alterações:
https://www.youtube.com/feeds/videos.xml?playlist_id=UULFcOkA2Xmk1valTOWSyKyp4gTem mais alguns IDs:
UU – todos os vídeos (videos + shorts + live streams)
UUMO – vídeos para membros (ou UUMF)
UULV – transmissões ao vivo
UUSH – todos os shorts
UULP – vídeos populares
UUPV – transmissões populares
UUPS – shorts populares
UUMV – transmissões para membros
UUMS – shorts para membros
caraca, que sensacional! eu bloqueava manualmente, quando eles colocam “#”, mas depois pararam com isso, aí sempre surgia no meu feed os shorts, agora consigo bloquear tudo, muito obrigado
@Ghedin, a “regra atualizada” acabou quebrada por conter tags HTML.
Tentando enviar por aqui:
EntryContent=(Read\smore\s*<\/a>\s*<\/p>\s*)$
Ou melhor: https://pastebin.com/nf0ufZz5
Deu! Bastou com o markdown para blocos de código. hehe
Muito legal a sua dica! Já vou usar pra filtrar alguns posts. Tem feed que eu até deixo de assinar pelo tanto de posts de oferta ou outras coisas que não me interessam.
Corrigi no post, Augusto. Valeu!