May
18
2009

Encontrar URL de radios dentro de páginas web usando wget y less

music@work
Creative Commons License photo credit: meeg-el

Generalmente las radios online dan un pequeño archivo que puedes bajar/abrir directamente con tu reproductor de música. Y así puedes guardarlo y ejecutarlo cada vez que quieras sin tener que visitar la página cada vez.

Eso es lo ideal. Pero también muchas buenas páginas web de radios tienen el reproductor incrustado. Eso no es ideal y lo vamos a arreglar altiro.

Nota para los vapuleados camaradas usuarios de MS-Windows:
Antes de seguir te digo que esto también lo puedes hacer en Windows mirando el código fuente (hay una opción para esto en el menú ver de Internet Explorer) y reingresando direcciones de frames, si es necesario, al mismo browser hasta encontrar el URL de la radio.

Nos abocaremos a esta tarea usando los comandos wget y less, para los cuales este post es sólo una introducción, ya profundizaremos más en estas herramientas super cojonudas:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
# Baja la página
wget http://www.elconquistadorfm.cl/radio2.html

# Mira su código HTML (-i: case insensitive para búsquedas)
less -i radio2.html

# Busca donde comienza la etiqueta object: Apreta / y escribe <object
# /<object[ENTER]
# Como usamos la opción -i encontrará tanto object como OBJECT

# Busca una etiqueta param cuyo atributo sea filename, url o src
# y copia su valor. Por ejemplo:
# <param name="filename" value="mms://200.27.86.250/radioconquistador3">

# q para salir de less

# Ya tienes el URL. Ahora puedes abrirlo con tu reproductor preferido.

# Yo uso exaile para snap my fingers
exaile mms://200.27.86.250/radioconquistador3 &
# Para recuperar la linea de comando [CONTROL]-c

Exaile es el reproductor por defecto en Zenwalk 6.

Hay páginas que incrustan el reproductor en etiquetas frame o iframe.

1
2
3
4
5
6
7
8
9
10
11
12
13
14
wget http://www.digitalfm.cl/
less -i index.html

# En este caso busca una etiqueta frame o iframe
# /frame[ENTER]
# <frame src="/prontus_digitalfm/site/edic/base/port/inicio.html">
# y copia el valor de su atributito src

# Vuele a salir de less y baja la página de ese frame directamente
# y luego continua como antes

wget http://www.digitalfm.cl/prontus_digitalfm/site/edic/base/port/inicio.html
less -i inicio.html
exaile mms://RUTASFM.mercurio.cl/lowstreaminternet2004 &

Hay aún otros casos donde se usa ajax para ejecutar el reproductor. Sólo te diré, y esto vale plata, que para tratar con páginas basadas en ajax debes analizar la transmisión de datos entre browser y servidor. Echa una mirada a wireshark.

Para este último caso no está de más decir que puedes contactarme para obtener ayuda específica.

Escrito por NomikOS en Linux, Tips y trucos cortos, May 18 - 2009 @ 15:17 hrs.
Hoy 2 lectores. Te agradecería que me dejaras un comentario. Gracias por tu visita. d [^_0]

2 comentarios

  • Jose V.:

    Hola, como estas, abusando de tus conocimientos quiero decirte que mi giro no son los sofware y quiero preguntarte si me puedes decir cual es el url de la sig pag.
    http://www.los40.com.mx/player/Radio/40Principales/index.html

    para poder escucharla en
    nexus radio
    o en
    screamer043

    dandote las gracias de antemano y brindandote la mano desde los angeles California Jose Valerio

    Firefox 3.6 Firefox 3.6 Windows Vista Windows Vista
    Mozilla/5.0 (Windows; U; Windows NT 6.0; es-ES; rv:1.9.2) Gecko/20100115 Firefox/3.6 (.NET CLR 3.5.30729)
    Comment | February 12, 2010 @ 11:42
  • NomikOS:

    Hola Jose Valerio,

    Acabo de ver esto e intertarlo y sí claro no es un caso para nada trivial. Amerita un trabajo más fino, para lo cual generalmente cobro algo. Pero te prometo que si me respondes de nuevo, aquí en mi blog, lo tomaré como un desafío. Y le dedicaré un poco + de tiempo.

    Gracias por tu comentario y tu saludo.-

    Igor.-

    Firefox 3.5.5 Firefox 3.5.5 GNU/Linux GNU/Linux
    Mozilla/5.0 (X11; U; Linux i686; en-US; rv:1.9.1.5) Gecko/20091102 Firefox/3.5.5
    Comment | February 18, 2010 @ 19:36

RSS feed para comentarios en este post

TrackBack URL

Deja un comentario

XHTML: Etiquetas permitidas: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>

Powered by WordPress. Theme: TheBuckmaker. Modifications by NomikOS