Crear una web parásito de películas

Hace unos días hice una encuesta para que eligierais mi tercer reto, la idea más votada con diferencia ha sido la de crear una web parásito de películas.

Básicamente tengo que hacer una web de películas (trailers) que se alimente con contenidos extraídos de APIs de terceros (por ejemplo la de inmdb) y contenidos espineados de otras webs para intentar posicionar mejor en google que webs parecidas (prefiero no citar ninguna por si acaso).

Podéis seguir mi reto en twitter con el hashtag #cabeseo3

Si queréis ver próximos retos suscribiros a mi canal de youtube

Reto medio-superado

verestrenosonline.com

Digo medio superado ya que ahora sólo falta tiempo para que google empiece a indexar los resultados.

Mi intención con el reto era aportar cosas que no suelen hacer este tipo de webs, estas son las que he hecho:

  • Es una web que se alimenta por si sola con las nuevas películas que se estrenan y con las búsquedas de los usuarios.
  • Sinopsis spineadas de wikipedia
  • Merchandising y productos relacionados de las películas de amazon
  • Microformatos
  • Certificado SSL

¿Qué permite verestrenosonline.com?

  • Ver la cartelera de las películas que hay en Madrid-España
  • Ver un ranking de las mejores películas según imdb
  • Filtrar películas por categorías
  • Ver trailers de películas de youtube
  • Encontrar merchandising relacionado con las películas

APIs usadas

  • OMDB para datos de películas (actores, director, año, etc)
  • Wikipedia (sinopsis)
  • Yandex para traducir la sinopsis de imdb
  • Espinner para spinear las sinopsis de wikipedia

Scrapping

  • IMDB (cartelera, ranking películas, buscador de películas)
  • Youtube (buscar trailers), sé que tienen API pero es un poco lío el tema y es más fácil hacer scrapping.
  • Amazon (merchandising), sé que tienen API pero a veces los resultados no son los mismos que su web.

Frontend

Backend

Tablas de la base de datos

  • Categories
  • Movies
  • Movie_categories

Guía paso a paso

Monetización

  • adfly Acortador de enlaces para ganar con clics
  • adbooth Banner fake player
  • popads popups

¿Por qué decidí usar mi propio framework PHP?

Para este proyecto quería hacer algo muy simple, los frameworks están bien pero a veces tienen mil historias y es matar moscas a cañonazos, sólo necesitaba llamar a la base de datos y enlaces bonitos para cuatro secciones.

¿Por qué decidí usar Materialize para el frontend?

Aparte de que la estructura de la web de la documentación me parecía muy en la línea de lo que tenía en mente, quería probar una alternativa a material de @daemonite.

Problema de spinear sinopsis de wikipedia

Si hay algo que no he podido automatizar de la web ha sido espinear las sinopsis de las películas de wikipedia, ya que wikipedia puede tener varias páginas relacionadas con una película, que si el cómic, serie de televisión, serie animada, etc.

He tenido que hacer un asistente que me muestra un listado de películas que tengo indexadas en la web sin sinopsis, luego selecciono que página de que página de wikipedia quiero obtener el texto y finalmente me sale un paso final con el texto obtenido con un botón para spinear el texto usando la API de espinner.net

Diario de idea a prototipo

Día 1
  • Registrar dominio
  • Recopilar webs para inspirarme.
  • Investigar APIs.
Día 2
  • Diseñar base de datos
  • Hacer listado últimas películas añadidas
  • Hacer ficha categoría
  • Hacer ficha de película
  • Hacer scrapping para insertar estrenos
  • Hacer script para poner las categorías de cada película
  • Hacer script para rellenar información de una película imdb http://www.omdbapi.com/
  • Paginación en los listados
Día 3
  • Integrar diseño matarializecss
  • Hacer buscador
  • Añadir trailer de youtube en la ficha
  • Cambiar fondo de la cabecera en la ficha de película
  • Empezando a traducir textos yandex
Día 4
  • Hacer buscador autocompletado
  • Arreglar detalles de diseño en la versión móvil
Día 5
  • Hacer sitemap.xml
  • Añadir sitemap a google webmaster tools
Día 6
  • Añadir películas con el buscador
  • Integrar Google Analytics
  • Integrar microformatos
  • Integrar javascript lazy load para mostrar las imágenes una vez cargada la web
  • Crear cron para añadir películas de la cartelera
  • Mostar productos de amazon relacionados
  • Integrar tweetcard y opengraph
  • Hacer RSS
  • Integrar ifttt para publicar automáticamente en redes sociales a partir del RSS.
  • Cambiar el autocompletado scrapping para incluir películas indexadas en la base de datos y resultados de imdb
  • Integrar acortador adly
  • Añadir botones para compartir en twitter y facebook en la ficha de película
  • Enviar solicitud de aprobación a adbooth y popads
Día 7
  • Hacer asistente para integrar las sinopsis de películas de wikipedia con opción de spinearlas con espinner.net
  • Añadir publicidad de adbooth y popads
  • Registar certificado SSL en dondominio.es

Agradecimientos

Si queréis saber algo más

Si me vais a preguntar sobre spinners más adelante escribiré un artículo sobre ello, si tenéis más dudas me podéis preguntar en el formulario de comentarios.