você está aqui: Home  → Arquivo de Mensagens

wget - Conheça as opções ou então dê seus pulos!

Colaboração: Raul Libório

Data de Publicação: 25 de Julho de 2008

Dessa vez quero contar um 'causo' que aconteceu com um amigo de um amigo meu, pois é... aconteceu comigo mesmo. Conhecer as várias opções de um certo programa é as vezes difícil, já que alguns tem dezenas, mas não são úteis pra gente.

Mas o causo foi assim... Estava eu a busca de músicas de uma banda chamada "Bloc Party", quando deu um stalo na cabeça!: "Por que não procurar no site da banda?!" Assim fiz. Chegando lá, WOW!!! 63 MÚSICAS! Mas... isso siginifica baixar 63 músicas, o que não é divertido ¬¬

Solução: SCRIPT :D

Criei uma solução que tinha a seguinte função:

  1. Baixe o código-fonte da página;
  2. Remova as tags;
  3. Coloque os links para os MP3's em outra lista;
  4. Baixe os arquivos da lista.

Simples assim :)

  #!/bin/bash
  # Baixa musicas da net :D
  SITE="http://www.blocparty.net/mp3.html"
  PAGINA=$( echo $SITE | cut -f4 -d/ )
  
  rm $PAGINA
  rm lista.txt
  
  #  ------- Script
  
  # -- Baixando a pagina
  wget $SITE
  
  # -- Lipando o codigo-fonte
  for linha in $( cat $PAGINA | sed 's/>/ > \n/g;s/a href=//;s/href=//g'|cut -d'"' -f2 |sed '/[ ]/d;/.mp[3$]/!d' )
  do
        # -- Obtendo apenas os links diretos para os arquivos em MP3
        echo -e $linha | sed '/.mp3/!d;/png/d;/gif/d;/jpg/d;/download/d' >> lista.txt
  
  done
  # -- Laco pra realizar o download das musicas
  for musica in $( cat lista.txt )
  do
        wget $musica
        echo -e "\v arquivo $musica baixado com sucesso"
  done
  
  exit 0

O código-fonte desse site é bizarro, o webdesigner fez com certeza de sacanagem! Não identou o código e nem deu espaço na parte onde tinha as músicas!

Mas enfim, coloquei pra o script pra rodar e fui dormir. Quando acordei... WOW!! 63 Músicas! Fiquei super feliz!

Alguns dias depois, lendo o site do Aurélio, me deparo com um comando:

  wget -m -L http://......

Eu pensei.... será que poderia ter resolvido com um comando? Foi então que lendo com mais cuidado o HELP do 'wget' que achei essa combinação:

  wget --ignore-tags=img -r "http://www.blocparty.net/mp3.html

Faz quase a mesma coisa, a diferença é que esse ainda cria uma pasta com a url do site e guarda as músicas lá.

Lição do dia:

Se for usar algum comando em algum script, LEIA COM ATENÇÃO o seu help. Poderá encurtar seus scripts em várias linhas. (o meu caiu de 28 pra 1 linha)



 

 

Veja a relação completa dos artigos de Raul Libório

Opinião dos Leitores

luizlmarins
13 Mai 2014, 15:44
eu já li o help, mas ainda não havia sacado essa .. valeu!
rato
16 Nov 2012, 00:07
foi boa
*Nome:
Email:
Me notifique sobre novos comentários nessa página
Oculte meu email
*Texto:
 
  Para publicar seu comentário, digite o código contido na imagem acima
 


Powered by Scriptsmill Comments Script