May
18
2009

Encontrar URL de radios dentro de páginas web usando wget y less.
Escrito por NomikOS el 18/May/2009 | 226 visitas

music@work
Creative Commons License photo credit: meeg-el

Generalmente las radios online dan un pequeño archivo que puedes bajar/abrir directamente con tu reproductor de música. Y así puedes guardarlo y ejecutarlo cada vez que quieras sin tener que visitar la página cada vez.

Eso es lo ideal. Pero también muchas buenas páginas web de radios tienen el reproductor incrustado. Eso no es ideal y lo vamos a arreglar altiro.

Nota para los vapuleados camaradas usuarios de MS-Windows:
Antes de seguir te digo que esto también lo puedes hacer en Windows mirando el código fuente (hay una opción para esto en el menú ver de Internet Explorer) y reingresando direcciones de frames, si es necesario, al mismo browser hasta encontrar el URL de la radio.

Nos abocaremos a esta tarea usando los comandos wget y less, para los cuales este post es sólo una introducción, ya profundizaremos más en estas herramientas super cojonudas:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
# Baja la página
wget http://www.elconquistadorfm.cl/radio2.html

# Mira su código HTML (-i: case insensitive para búsquedas)
less -i radio2.html

# Busca donde comienza la etiqueta object: Apreta / y escribe <object
# /<object[ENTER]
# Como usamos la opción -i encontrará tanto object como OBJECT

# Busca una etiqueta param cuyo atributo sea filename, url o src
# y copia su valor. Por ejemplo:
# <param name="filename" value="mms://200.27.86.250/radioconquistador3">

# q para salir de less

# Ya tienes el URL. Ahora puedes abrirlo con tu reproductor preferido.

# Yo uso exaile para snap my fingers
exaile mms://200.27.86.250/radioconquistador3 &
# Para recuperar la linea de comando [CONTROL]-c

Exaile es el reproductor por defecto en Zenwalk 6.

Hay páginas que incrustan el reproductor en etiquetas frame o iframe.

1
2
3
4
5
6
7
8
9
10
11
12
13
14
wget http://www.digitalfm.cl/
less -i index.html

# En este caso busca una etiqueta frame o iframe
# /frame[ENTER]
# <frame src="/prontus_digitalfm/site/edic/base/port/inicio.html">
# y copia el valor de su atributito src

# Vuele a salir de less y baja la página de ese frame directamente
# y luego continua como antes

wget http://www.digitalfm.cl/prontus_digitalfm/site/edic/base/port/inicio.html
less -i inicio.html
exaile mms://RUTASFM.mercurio.cl/lowstreaminternet2004 &

Hay aún otros casos donde se usa ajax para ejecutar el reproductor. Sólo te diré, y esto vale plata, que para tratar con páginas basadas en ajax debes analizar la transmisión de datos entre browser y servidor. Echa una mirada a wireshark.

Para este último caso no está de más decir que puedes contactarme para obtener ayuda específica.

Escrito por NomikOS en Linux,Tips y trucos cortos, May 18 - 2009 @ 15:17 hrs. | 226 visitas

RSS feed para comentarios en este post

TrackBack URL

Deja un comentario

XHTML: Etiquetas permitidas: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>

motor: WordPress. tema: TheBuckmaker modificado por NomikOS.