Add support for slideshare.net
[GM_direct_download_links.git] / direct_download_links.user.js
index 89fa057..f9d51e1 100644 (file)
@@ -1,7 +1,7 @@
 // direct_download_links - Add direct download links
 // direct_download_links - Add direct download links
-// version 0.3
-// 2011-12-23
-// Copyright (C) 2011  Antonio Ospite <ospite@studenti.unina.it>
+// version 0.4
+// 2012-02-12
+// Copyright (C) 2011,2012  Antonio Ospite <ospite@studenti.unina.it>
 // Released under the GPL license
 // http://www.gnu.org/copyleft/gpl.html
 //
 // Released under the GPL license
 // http://www.gnu.org/copyleft/gpl.html
 //
 // @name           Direct Download Links
 // @namespace      http://git.ao2.it/GM_direct_download_links.git
 // @description    Add direct download links
 // @name           Direct Download Links
 // @namespace      http://git.ao2.it/GM_direct_download_links.git
 // @description    Add direct download links
+// @grant          GM_log
+// @grant          GM_xmlhttpRequest
 // @include        http://video.repubblica.it/*
 // @include        http://tv.repubblica.it/*
 // @include        http://trovacinema.repubblica.it/*
 // @include        http://www.kataweb.it/tvzap/*
 // @include        http://www.rai.tv/*
 // @include        http://video.repubblica.it/*
 // @include        http://tv.repubblica.it/*
 // @include        http://trovacinema.repubblica.it/*
 // @include        http://www.kataweb.it/tvzap/*
 // @include        http://www.rai.tv/*
+// @include        http://soundcloud.com/*
+// @include        http://www.telecinco.es/*
+// @include        http://slideshare.net/*
+// @include        http://www.slideshare.net/*
 // ==/UserScript==
 //
 
 // ==/UserScript==
 //
 
  *  - find a way to use the same string as in the @include lines to match the
  *    current window.location. Look for something like GM_testUrl() which builds
  *    the regexp starting from a glob line.
  *  - find a way to use the same string as in the @include lines to match the
  *    current window.location. Look for something like GM_testUrl() which builds
  *    the regexp starting from a glob line.
- *  - use xpath instead of regexp like in http://a32.me/2009/11/greasemonkey/
  *  - use jquery, like shown in http://a32.me/2009/11/greasemonkey/
  *  - use jquery, like shown in http://a32.me/2009/11/greasemonkey/
+ *  - Support the "download" attribute for anchors:
+ *    http://www.whatwg.org/specs/web-apps/current-work/multipage/links.html#downloading-resources
  */
 
 /* Fields supported by the "site" object.
  *
  * Manadatory fields:
  */
 
 /* Fields supported by the "site" object.
  *
  * Manadatory fields:
- *   pageURL: the URL of the page we are modifying
- *   urlContainer: the element containing the URL to link
+ *   locationRegExp: the regexp describing the URL of the page we are modifying
+ *   urlContainerXPath: the XPath of the element containing the URL to link
  *   urlRegexp: the regular expression for finding the URL, the first
  *              sub-pattern is taken as the URL
  *   urlRegexp: the regular expression for finding the URL, the first
  *              sub-pattern is taken as the URL
- *   linkDest: the element where to place the Direct Download link
+ *   linkDestXPath: the XPath of the element where to place the Direct Download link
  *
  *
  * Optional fields:
  *
  *
  * Optional fields:
 var supported_sites = [
   {
     locationRegexp: /^http:\/\/video\.repubblica\.it\/.*$/,
 var supported_sites = [
   {
     locationRegexp: /^http:\/\/video\.repubblica\.it\/.*$/,
-    urlContainer: 'contA',
-    urlRegexp: /'pcUrl', '((http|mms):\/\/[^']*)'/,
-    linkDest: 'contA',
+    urlContainerXPath: '//div[@id="contA"]',
+    urlRegexp: /[^\/]addParam\('format', '[^']*', '((http|mms):\/\/[^']*)'/,
+    linkDestXPath: '//div[@id="contA"]',
   },
   {
     locationRegexp: /^http:\/\/tv\.repubblica\.it\/.*$/,
   },
   {
     locationRegexp: /^http:\/\/tv\.repubblica\.it\/.*$/,
-    urlContainer: 'boxPlayer',
+    urlContainerXPath: '//div[@id="boxPlayer"]',
     urlRegexp: /'pcUrl', '((http|mms):\/\/[^']*)'/,
     linkDest: 'box_embed',
     urlRegexp: /'pcUrl', '((http|mms):\/\/[^']*)'/,
     linkDest: 'box_embed',
+    linkDestXPath: '//div[@id="box_embed"]',
   },
   {
     locationRegexp: /^http:\/\/trovacinema\.repubblica\.it\/.*$/,
   },
   {
     locationRegexp: /^http:\/\/trovacinema\.repubblica\.it\/.*$/,
-    urlContainer: 'col-center',
+    urlContainerXPath: '//div[@id="col-center"]',
     urlRegexp: /'flvUrl', '((http|mms):\/\/[^']*)'/,
     urlRegexp: /'flvUrl', '((http|mms):\/\/[^']*)'/,
-    linkDest: 'col-center',
+    linkDestXPath: '//div[@id="col-center"]',
   },
   {
     locationRegexp: /^http:\/\/www\.kataweb\.it\/tvzap\/.*$/,
   },
   {
     locationRegexp: /^http:\/\/www\.kataweb\.it\/tvzap\/.*$/,
-    urlContainer: 'tvzap_video',
-    urlRegexp: /'pcUrl', '((http|mms):\/\/[^']*)'/,
-    linkDest: 'playerCont',
+    urlContainerXPath: '//div[@id="contAB"]',
+    urlRegexp: /[^\/]addParam\('pcUrl', '((http|mms):\/\/[^']*)'/,
+    linkDestXPath: '//div[@id="contAB"]',
   },
   {
     locationRegexp: /^http:\/\/www\.rai\.tv\/.*$/,
   },
   {
     locationRegexp: /^http:\/\/www\.rai\.tv\/.*$/,
-      initCommand: function(site) {
-        unsafeWindow.Silverlight.isInstalled = function(version) {
-          return true;
-        };
+    initCommand: function(site) {
+      unsafeWindow.Silverlight.isInstalled = function(version) {
+        return true;
+      };
     },
     },
-    urlContainer: 'Player',
-    urlRegexp: /mediaUri=(http:\/\/[^,]*)/,
+    urlContainerXPath: '//div[@id="silverlightControlHost" or @id="SilverlightPlayer"]',
+    urlRegexp: /mediaUri=(http:\/\/[^,"]*)/,
     onEvent: { evt: 'DOMNodeInserted', targetElement: 'object' },
     processURL: _rai_get_actual_url,
     onEvent: { evt: 'DOMNodeInserted', targetElement: 'object' },
     processURL: _rai_get_actual_url,
-    linkDest: 'Player',
+    linkDestXPath: '//div[@id="silverlightControlHost" or @id="SilverlightPlayer"]',
+  },
+  {
+    locationRegexp: /^http:\/\/soundcloud.com\/.*$/,
+    urlContainerXPath: '//div[@id="main-content-inner"]',
+    urlRegexp: /"streamUrl":"([^"]*)"/,
+    linkDestXPath: '//div[@id="main-content-inner"]',
+  },
+  {
+    locationRegexp: /^http:\/\/www\.telecinco.es\/.*$/,
+    urlContainerXPath: '//video[@class="video-js"]',
+    urlRegexp: /src="([^"]*)"/,
+    linkDestXPath: '//div[@class="pg-bd"]',
+  },
+  {
+    locationRegexp: /^http:\/\/(www\.|)slideshare.net\/.*$/,
+    urlContainerXPath: '//script[@id="page-json"]',
+    urlRegexp: /"ppt_location":"([^"]*)"/,
+    processURL: function(site, object_id) {
+      var URL = 'http://s3.amazonaws.com/slideshare/' + object_id + '.xml';
+      var evt = document.createEvent('Event');
+      evt.initEvent('UrlFetched', true, true);
+      evt.site = site;
+      evt.URL = URL;
+      document.dispatchEvent(evt);
+      return;
+    },
+    linkDestXPath: '//div[@class="playerWrapper"]',
   },
 ];
 
   },
 ];
 
@@ -125,6 +160,17 @@ for (i = 0; i < supported_sites.length; i++) {
   }
 }
 
   }
 }
 
+function getElementByXPath(query, root) {
+  return document.evaluate(query, root || document, null, XPathResult.ANY_UNORDERED_NODE_TYPE, null).singleNodeValue;
+}
+
+/* from http://stackoverflow.com/questions/1912501 */
+function htmlDecode(input){
+  var e = document.createElement('div');
+  e.innerHTML = input;
+  return e.childNodes.length === 0 ? "" : e.childNodes[0].nodeValue;
+}
+
 /**
  * Add a Direct Download link on the page for the specified URL
  *
 /**
  * Add a Direct Download link on the page for the specified URL
  *
@@ -133,9 +179,10 @@ for (i = 0; i < supported_sites.length; i++) {
  * @return: null on error, true on success
  */
 function direct_download_link_add(pageURL, site) {
  * @return: null on error, true on success
  */
 function direct_download_link_add(pageURL, site) {
-  var element = document.getElementById(site.urlContainer);
+  site.pageURL = pageURL;
+  var element = getElementByXPath(site.urlContainerXPath);
   if (!element) {
   if (!element) {
-    DDL_log('DirectDL (' + site.pageURL  + '): Cannot find the element ' + site.urlContainer + ' containing the URL.');
+    DDL_log('DirectDL (' + site.pageURL  + '): Cannot find the element ' + site.urlContainerXPath + ' containing the URL.');
     return null;
   }
 
     return null;
   }
 
@@ -184,7 +231,7 @@ function _get_URL(site, element) {
   var evt = document.createEvent('Event');
   evt.initEvent('UrlFetched', true, true);
   evt.site = site;
   var evt = document.createEvent('Event');
   evt.initEvent('UrlFetched', true, true);
   evt.site = site;
-  evt.URL = URL;
+  evt.URL = htmlDecode(URL);
   document.dispatchEvent(evt);
 }
 
   document.dispatchEvent(evt);
 }
 
@@ -192,7 +239,7 @@ function _add_link(e) {
   var site = e.site;
   var URL = e.URL;;
 
   var site = e.site;
   var URL = e.URL;;
 
-  var destination = document.getElementById(site.linkDest);
+  var destination = getElementByXPath(site.linkDestXPath);
   if (!destination) {
     DDL_log('DirectDl (' + site.pageURL + '): Cannot add the direct download link.');
     return;
   if (!destination) {
     DDL_log('DirectDl (' + site.pageURL + '): Cannot add the direct download link.');
     return;
@@ -254,9 +301,21 @@ function _rai_get_actual_url(site, URL) {
         parser = new DOMParser();
         xmlDoc = parser.parseFromString(text, "text/xml");
 
         parser = new DOMParser();
         xmlDoc = parser.parseFromString(text, "text/xml");
 
-        ref = xmlDoc.getElementsByTagName('REF');
-        if (ref.length > 0) {
-          href = ref[0].getAttribute('HREF');;
+        // MMS streams
+        elems = xmlDoc.getElementsByTagName('REF');
+        if (elems.length > 0) {
+          href = elems[0].getAttribute('HREF');;
+
+          var evt = document.createEvent('Event');
+          evt.initEvent('UrlFetched', true, true);
+          evt.site = site;
+          evt.URL = href;
+          document.dispatchEvent(evt);
+        }
+        // SmoothStreaming streams
+        elems = xmlDoc.getElementsByTagName('playListItem');
+        if (elems.length > 0) {
+          href = elems[0].getAttribute('mediaSource');;
 
           var evt = document.createEvent('Event');
           evt.initEvent('UrlFetched', true, true);
 
           var evt = document.createEvent('Event');
           evt.initEvent('UrlFetched', true, true);