From 914c6e86f1689ae186a0db836e7f0304d72c38b4 Mon Sep 17 00:00:00 2001
From: Joshua Harlow <harlowja@yahoo-inc.com>
Date: Thu, 18 Oct 2012 10:34:38 -0700
Subject: Start fixing how boto and our url fetching can not use ssl correctly
 (they can not do validation due to the underlying usage of urllib/httplib).
 Adjust to use urllib3 which can in cloud-init url fetching. For now also take
 the metadata/userdata extraction code from boto (small amount) and fix it in
 a new local file called 'ec2_utils'.

---
 cloudinit/ec2_utils.py | 135 +++++++++++++++++++++++++++++++++++++++++++++++++
 1 file changed, 135 insertions(+)
 create mode 100644 cloudinit/ec2_utils.py

(limited to 'cloudinit/ec2_utils.py')

diff --git a/cloudinit/ec2_utils.py b/cloudinit/ec2_utils.py
new file mode 100644
index 00000000..ef7fac7d
--- /dev/null
+++ b/cloudinit/ec2_utils.py
@@ -0,0 +1,135 @@
+# vi: ts=4 expandtab
+#
+#    Copyright (C) 2012 Yahoo! Inc.
+#
+#    Author: Joshua Harlow <harlowja@yahoo-inc.com>
+#
+#    This program is free software: you can redistribute it and/or modify
+#    it under the terms of the GNU General Public License version 3, as
+#    published by the Free Software Foundation.
+#
+#    This program is distributed in the hope that it will be useful,
+#    but WITHOUT ANY WARRANTY; without even the implied warranty of
+#    MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
+#    GNU General Public License for more details.
+#
+#    You should have received a copy of the GNU General Public License
+#    along with this program.  If not, see <http://www.gnu.org/licenses/>.
+
+import json
+import urllib
+
+from cloudinit import log as logging
+from cloudinit import url_helper as uh
+from cloudinit import util
+
+LOG = logging.getLogger(__name__)
+
+
+# For now take this and fix it...
+class LazyLoadMetadata(dict):
+    def __init__(self, url, fetch_timeout, num_retries, ssl_details):
+        self._url = url
+        self._num_retries = num_retries
+        self._ssl_details = ssl_details
+        self._fetch_timeout = fetch_timeout
+        self._leaves = {}
+        self._dicts = []
+        response = uh.readurl(url, timeout=fetch_timeout,
+                              retries=num_retries, ssl_details=ssl_details)
+        data = str(response)
+        if data:
+            fields = data.split('\n')
+            for field in fields:
+                if field.endswith('/'):
+                    key = field[0:-1]
+                    self._dicts.append(key)
+                else:
+                    p = field.find('=')
+                    if p > 0:
+                        key = field[p + 1:]
+                        resource = field[0:p] + '/openssh-key'
+                    else:
+                        key = resource = field
+                    self._leaves[key] = resource
+                self[key] = None
+
+    def _materialize(self):
+        for key in self:
+            self[key]
+
+    def __getitem__(self, key):
+        if key not in self:
+            # Allow dict to throw the KeyError
+            return super(LazyLoadMetadata, self).__getitem__(key)
+
+        # Already loaded
+        val = super(LazyLoadMetadata, self).__getitem__(key)
+        if val is not None:
+            return val
+
+        if key in self._leaves:
+            resource = self._leaves[key]
+            new_url = self._url + urllib.quote(resource, safe="/:")
+            response = uh.readurl(new_url, retries=self._num_retries,
+                                  timeout=self._fetch_timeout,
+                                  ssl_details=self._ssl_details)
+            val = str(response)
+            if val and val[0] == '{':
+                val = json.loads(val)
+            else:
+                p = val.find('\n')
+                if p > 0:
+                    val = val.split('\n')
+            self[key] = val
+        elif key in self._dicts:
+            new_url = self._url + key + '/'
+            self[key] = LazyLoadMetadata(new_url,
+                                         num_retries=self._num_retries,
+                                         fetch_timeout=self._fetch_timeout,
+                                         ssl_details=self._ssl_details)
+
+        return super(LazyLoadMetadata, self).__getitem__(key)
+
+    def get(self, key, default=None):
+        try:
+            return self[key]
+        except KeyError:
+            return default
+
+    def values(self):
+        self._materialize()
+        return super(LazyLoadMetadata, self).values()
+
+    def items(self):
+        self._materialize()
+        return super(LazyLoadMetadata, self).items()
+
+    def __str__(self):
+        self._materialize()
+        return super(LazyLoadMetadata, self).__str__()
+
+    def __repr__(self):
+        self._materialize()
+        return super(LazyLoadMetadata, self).__repr__()
+
+
+def get_instance_userdata(url, version='latest', ssl_details=None):
+    ud_url = '%s/%s/user-data' % (url, version)
+    try:
+        response = uh.readurl(ud_url, timeout=5,
+                              retries=10, ssl_details=ssl_details)
+        return str(response)
+    except Exception as e:
+        util.logexc(LOG, "Failed fetching url %s", ud_url)
+        return None
+
+
+def get_instance_metadata(url, version='latest', ssl_details=None):
+    md_url = '%s/%s/meta-data' % (url, version)
+    try:
+        return LazyLoadMetadata(md_url, timeout=5, 
+                                retries=10, ssl_details=ssl_details)
+    except Exception as e:
+        util.logexc(LOG, "Failed fetching url %s", md_url)
+        return None
-- 
cgit v1.2.3


From 7c9bbbc9b49425e3ba8e0517908477c58ea51d4b Mon Sep 17 00:00:00 2001
From: Joshua Harlow <harlowja@yahoo-inc.com>
Date: Fri, 19 Oct 2012 14:06:21 -0700
Subject: Remove the need for boto just for fetching the userdata and metadata.
 Add in this crawling functionality to the ec2_utils module that will fully
 crawl (not lazily) the ec2 metadata and parse it in the same manner as boto.

1. Make the ec2 datasource + cloudstack now call into these.
2. Fix phone_home due to urllib3 change (TBD)
---
 Requires                                  |   5 -
 cloudinit/config/cc_phone_home.py         |   2 +-
 cloudinit/ec2_utils.py                    | 210 +++++++++++++++++-------------
 cloudinit/sources/DataSourceCloudStack.py |   9 +-
 cloudinit/sources/DataSourceEc2.py        |   9 +-
 cloudinit/url_helper.py                   |  16 +--
 6 files changed, 131 insertions(+), 120 deletions(-)

(limited to 'cloudinit/ec2_utils.py')

diff --git a/Requires b/Requires
index b23dd4e9..13a5d997 100644
--- a/Requires
+++ b/Requires
@@ -10,11 +10,6 @@ PrettyTable
 # datasource is removed, this is no longer needed
 oauth
 
-# This is used to fetch the ec2 metadata into a easily
-# parseable format, instead of having to have cloud-init perform
-# those same fetchs and decodes and signing (...) that ec2 requires.
-boto
-
 # This is only needed for places where we need to support configs in a manner
 # that the built-in config parser is not sufficent (ie
 # when we need to preserve comments, or do not have a top-level
diff --git a/cloudinit/config/cc_phone_home.py b/cloudinit/config/cc_phone_home.py
index ae1349eb..a268d66f 100644
--- a/cloudinit/config/cc_phone_home.py
+++ b/cloudinit/config/cc_phone_home.py
@@ -112,7 +112,7 @@ def handle(name, cfg, cloud, log, args):
     }
     url = templater.render_string(url, url_params)
     try:
-        uhelp.readurl(url, data=real_submit_keys, retries=tries, sec_between=3)
+        uhelp.readurl(url, data=real_submit_keys, retries=tries)
     except:
         util.logexc(log, ("Failed to post phone home data to"
                           " %s in %s tries"), url, tries)
diff --git a/cloudinit/ec2_utils.py b/cloudinit/ec2_utils.py
index ef7fac7d..b9d7a2f7 100644
--- a/cloudinit/ec2_utils.py
+++ b/cloudinit/ec2_utils.py
@@ -16,6 +16,8 @@
 #    You should have received a copy of the GNU General Public License
 #    along with this program.  If not, see <http://www.gnu.org/licenses/>.
 
+from urlparse import (urlparse, urlunparse)
+
 import json
 import urllib
 
@@ -26,110 +28,132 @@ from cloudinit import util
 LOG = logging.getLogger(__name__)
 
 
-# For now take this and fix it...
-class LazyLoadMetadata(dict):
-    def __init__(self, url, fetch_timeout, num_retries, ssl_details):
-        self._url = url
-        self._num_retries = num_retries
-        self._ssl_details = ssl_details
-        self._fetch_timeout = fetch_timeout
-        self._leaves = {}
-        self._dicts = []
-        response = uh.readurl(url, timeout=fetch_timeout,
-                              retries=num_retries, ssl_details=ssl_details)
-        data = str(response)
-        if data:
-            fields = data.split('\n')
-            for field in fields:
-                if field.endswith('/'):
-                    key = field[0:-1]
-                    self._dicts.append(key)
-                else:
-                    p = field.find('=')
-                    if p > 0:
-                        key = field[p + 1:]
-                        resource = field[0:p] + '/openssh-key'
-                    else:
-                        key = resource = field
-                    self._leaves[key] = resource
-                self[key] = None
-
-    def _materialize(self):
-        for key in self:
-            self[key]
-
-    def __getitem__(self, key):
-        if key not in self:
-            # Allow dict to throw the KeyError
-            return super(LazyLoadMetadata, self).__getitem__(key)
-
-        # Already loaded
-        val = super(LazyLoadMetadata, self).__getitem__(key)
-        if val is not None:
-            return val
-
-        if key in self._leaves:
-            resource = self._leaves[key]
-            new_url = self._url + urllib.quote(resource, safe="/:")
-            response = uh.readurl(new_url, retries=self._num_retries,
-                                  timeout=self._fetch_timeout,
-                                  ssl_details=self._ssl_details)
-            val = str(response)
-            if val and val[0] == '{':
-                val = json.loads(val)
+def combine_url(base, add_on):
+    base_parsed = list(urlparse(base))
+    path = base_parsed[2]
+    if path and not path.endswith("/"):
+        path += "/"
+    path += urllib.quote(str(add_on), safe="/:")
+    base_parsed[2] = path
+    return urlunparse(base_parsed)
+
+
+# See: http://bit.ly/TyoUQs
+class MetadataMaterializer(object):
+    def __init__(self, blob, base_url, **fetch_settings):
+        self._blob = blob
+        self._md = None
+        self._base_url = base_url
+        self._fetch_settings = fetch_settings
+
+    def _parse(self, blob):
+        leaves = {}
+        children = []
+        if not blob:
+            return (leaves, children)
+
+        def has_children(item):
+            if item.endswith("/"):
+                return True
+            else:
+                return False
+
+        def get_name(item):
+            if item.endswith("/"):
+                return item.rstrip("/")
+            return item
+
+        for field in blob.splitlines():
+            field = field.strip()
+            field_name = get_name(field)
+            if not field or not field_name:
+                continue
+            if has_children(field):
+                if field_name not in children:
+                    children.append(field_name)
+            else:
+                contents = field.split("=", 1)
+                resource = field_name
+                if len(contents) > 1:
+                    # What a PITA...
+                    (ident, sub_contents) = contents
+                    checked_ident = util.safe_int(ident)
+                    if checked_ident is not None:
+                        resource = "%s/openssh-key" % (checked_ident)
+                        field_name = sub_contents
+                leaves[field_name] = resource
+        return (leaves, children)
+
+    def materialize(self):
+        if self._md is not None:
+            return self._md
+        self._md = self._materialize(self._blob, self._base_url)
+        return self._md
+
+    def _fetch_url(self, url, **opts):
+        response = uh.readurl(url, **opts)
+        return str(response)
+
+    def _decode_leaf_blob(self, blob):
+        if not blob:
+            return blob
+        stripped_blob = blob.strip()
+        if stripped_blob.startswith("{") and stripped_blob.endswith("}"):
+            # Assume and try with json
+            try:
+                return json.loads(blob)
+            except (ValueError, TypeError):
+                pass
+        if blob.find("\n") != -1:
+            return blob.splitlines()
+        return blob
+
+    def _materialize(self, blob, base_url):
+        (leaves, children) = self._parse(blob)
+        child_contents = {}
+        for c in children:
+            child_url = combine_url(base_url, c)
+            if not child_url.endswith("/"):
+                child_url += "/"
+            child_blob = self._fetch_url(child_url, **self._fetch_settings)
+            child_contents[c] = self._materialize(child_blob, child_url)
+        leaf_contents = {}
+        for (field, resource) in leaves.items():
+            leaf_url = combine_url(base_url, resource)
+            leaf_blob = self._fetch_url(leaf_url, **self._fetch_settings)
+            leaf_contents[field] = self._decode_leaf_blob(leaf_blob)
+        joined = {}
+        joined.update(child_contents)
+        for field in leaf_contents.keys():
+            if field in joined:
+                LOG.warn("Duplicate key found in results from %s", base_url)
             else:
-                p = val.find('\n')
-                if p > 0:
-                    val = val.split('\n')
-            self[key] = val
-        elif key in self._dicts:
-            new_url = self._url + key + '/'
-            self[key] = LazyLoadMetadata(new_url,
-                                         num_retries=self._num_retries,
-                                         fetch_timeout=self._fetch_timeout,
-                                         ssl_details=self._ssl_details)
-
-        return super(LazyLoadMetadata, self).__getitem__(key)
-
-    def get(self, key, default=None):
-        try:
-            return self[key]
-        except KeyError:
-            return default
-
-    def values(self):
-        self._materialize()
-        return super(LazyLoadMetadata, self).values()
-
-    def items(self):
-        self._materialize()
-        return super(LazyLoadMetadata, self).items()
-
-    def __str__(self):
-        self._materialize()
-        return super(LazyLoadMetadata, self).__str__()
-
-    def __repr__(self):
-        self._materialize()
-        return super(LazyLoadMetadata, self).__repr__()
+                joined[field] = leaf_contents[field]
+        return joined
 
 
 def get_instance_userdata(url, version='latest', ssl_details=None):
-    ud_url = '%s/%s/user-data' % (url, version)
+    ud_url = combine_url(url, version)
+    ud_url = combine_url(ud_url, 'user-data')
     try:
         response = uh.readurl(ud_url, timeout=5,
                               retries=10, ssl_details=ssl_details)
         return str(response)
-    except Exception as e:
-        util.logexc(LOG, "Failed fetching url %s", ud_url)
+    except Exception:
+        util.logexc(LOG, "Failed fetching userdata from url %s", ud_url)
         return None
 
 
 def get_instance_metadata(url, version='latest', ssl_details=None):
-    md_url = '%s/%s/meta-data' % (url, version)
+    md_url = combine_url(url, version)
+    md_url = combine_url(md_url, 'meta-data')
     try:
-        return LazyLoadMetadata(md_url, timeout=5, 
-                                retries=10, ssl_details=ssl_details)
-    except Exception as e:
-        util.logexc(LOG, "Failed fetching url %s", md_url)
+        response = uh.readurl(md_url, timeout=5,
+                              retries=10, ssl_details=ssl_details)
+        materializer = MetadataMaterializer(str(response), md_url,
+                                            timeout=5, retries=10,
+                                            ssl_details=ssl_details)
+        return materializer.materialize()
+    except Exception:
+        util.logexc(LOG, "Failed fetching metadata from url %s", md_url)
         return None
diff --git a/cloudinit/sources/DataSourceCloudStack.py b/cloudinit/sources/DataSourceCloudStack.py
index f7ffa7cb..2654df53 100644
--- a/cloudinit/sources/DataSourceCloudStack.py
+++ b/cloudinit/sources/DataSourceCloudStack.py
@@ -26,8 +26,7 @@ from struct import pack
 import os
 import time
 
-import boto.utils as boto_utils
-
+from cloudinit import ec2_utils
 from cloudinit import log as logging
 from cloudinit import sources
 from cloudinit import url_helper as uhelp
@@ -116,10 +115,8 @@ class DataSourceCloudStack(sources.DataSource):
             if not self.wait_for_metadata_service():
                 return False
             start_time = time.time()
-            self.userdata_raw = boto_utils.get_instance_userdata(self.api_ver,
-                None, self.metadata_address)
-            self.metadata = boto_utils.get_instance_metadata(self.api_ver,
-                self.metadata_address)
+            self.userdata_raw = ec2_utils.get_instance_userdata(self.metadata_address, self.api_ver)
+            self.metadata = ec2_utils.get_instance_metadata(self.metadata_address, self.api_ver)
             LOG.debug("Crawl of metadata service took %s seconds",
                       int(time.time() - start_time))
             return True
diff --git a/cloudinit/sources/DataSourceEc2.py b/cloudinit/sources/DataSourceEc2.py
index 3686fa10..204963e7 100644
--- a/cloudinit/sources/DataSourceEc2.py
+++ b/cloudinit/sources/DataSourceEc2.py
@@ -23,8 +23,7 @@
 import os
 import time
 
-import boto.utils as boto_utils
-
+from cloudinit import ec2_utils
 from cloudinit import log as logging
 from cloudinit import sources
 from cloudinit import url_helper as uhelp
@@ -65,10 +64,8 @@ class DataSourceEc2(sources.DataSource):
             if not self.wait_for_metadata_service():
                 return False
             start_time = time.time()
-            self.userdata_raw = boto_utils.get_instance_userdata(self.api_ver,
-                None, self.metadata_address)
-            self.metadata = boto_utils.get_instance_metadata(self.api_ver,
-                self.metadata_address)
+            self.userdata_raw = ec2_utils.get_instance_userdata(self.metadata_address, self.api_ver)
+            self.metadata = ec2_utils.get_instance_metadata(self.metadata_address, self.api_ver)
             LOG.debug("Crawl of metadata service took %s seconds",
                        int(time.time() - start_time))
             return True
diff --git a/cloudinit/url_helper.py b/cloudinit/url_helper.py
index e3f63021..2c9d5eef 100644
--- a/cloudinit/url_helper.py
+++ b/cloudinit/url_helper.py
@@ -22,11 +22,10 @@
 
 from contextlib import closing
 
-import errno
-import socket
 import time
 import urllib
 
+from urllib3 import exceptions
 from urllib3 import connectionpool
 from urllib3 import util
 
@@ -91,7 +90,10 @@ def readurl(url, data=None, timeout=None, retries=0,
             'url': p_url.request_uri,
         }
         if data is not None:
-            open_args['body'] = urllib.urlencode(data)
+            if isinstance(data, (str, basestring)):
+                open_args['body'] = data
+            else:
+                open_args['body'] = urllib.urlencode(data)
             open_args['method'] = 'POST'
         if not headers:
             headers = {
@@ -112,7 +114,7 @@ def wait_for_url(urls, max_wait=None, timeout=None,
     max_wait:  roughly the maximum time to wait before giving up
                The max time is *actually* len(urls)*timeout as each url will
                be tried once and given the timeout provided.
-    timeout:   the timeout provided to urllib2.urlopen
+    timeout:   the timeout provided to urlopen
     status_cb: call method with string message when a url is not available
     headers_cb: call method with single argument of url to get headers
                 for request.
@@ -174,12 +176,8 @@ def wait_for_url(urls, max_wait=None, timeout=None,
                     e = ValueError(reason)
                 else:
                     return url
-            except urllib2.HTTPError as e:
+            except exceptions.HTTPError as e:
                 reason = "http error [%s]" % e.code
-            except urllib2.URLError as e:
-                reason = "url error [%s]" % e.reason
-            except socket.timeout as e:
-                reason = "socket timeout [%s]" % e
             except Exception as e:
                 reason = "unexpected error [%s]" % e
 
-- 
cgit v1.2.3


From 6d40d5b2e3da9577d4a2686444d47125e62817fe Mon Sep 17 00:00:00 2001
From: harlowja <harlowja@virtualbox.rhel>
Date: Tue, 19 Feb 2013 22:51:49 -0800
Subject: Continue working on integrating requests.

---
 cloudinit/config/cc_phone_home.py   |  4 +--
 cloudinit/ec2_utils.py              | 24 +++++--------
 cloudinit/sources/DataSourceEc2.py  |  2 +-
 cloudinit/sources/DataSourceMAAS.py | 16 +++++----
 cloudinit/url_helper.py             | 50 ++++++++++++++++++++++----
 cloudinit/user_data.py              |  7 ++--
 cloudinit/util.py                   | 71 ++++++++++++++++++++++++++++++++-----
 7 files changed, 129 insertions(+), 45 deletions(-)

(limited to 'cloudinit/ec2_utils.py')

diff --git a/cloudinit/config/cc_phone_home.py b/cloudinit/config/cc_phone_home.py
index ae1349eb..90834080 100644
--- a/cloudinit/config/cc_phone_home.py
+++ b/cloudinit/config/cc_phone_home.py
@@ -19,7 +19,6 @@
 #    along with this program.  If not, see <http://www.gnu.org/licenses/>.
 
 from cloudinit import templater
-from cloudinit import url_helper as uhelp
 from cloudinit import util
 
 from cloudinit.settings import PER_INSTANCE
@@ -112,7 +111,8 @@ def handle(name, cfg, cloud, log, args):
     }
     url = templater.render_string(url, url_params)
     try:
-        uhelp.readurl(url, data=real_submit_keys, retries=tries, sec_between=3)
+        util.read_file_or_url(url, data=real_submit_keys,
+                              retries=tries, sec_between=3)
     except:
         util.logexc(log, ("Failed to post phone home data to"
                           " %s in %s tries"), url, tries)
diff --git a/cloudinit/ec2_utils.py b/cloudinit/ec2_utils.py
index b9d7a2f7..c422eea9 100644
--- a/cloudinit/ec2_utils.py
+++ b/cloudinit/ec2_utils.py
@@ -22,7 +22,6 @@ import json
 import urllib
 
 from cloudinit import log as logging
-from cloudinit import url_helper as uh
 from cloudinit import util
 
 LOG = logging.getLogger(__name__)
@@ -40,11 +39,10 @@ def combine_url(base, add_on):
 
 # See: http://bit.ly/TyoUQs
 class MetadataMaterializer(object):
-    def __init__(self, blob, base_url, **fetch_settings):
+    def __init__(self, blob, base_url):
         self._blob = blob
         self._md = None
         self._base_url = base_url
-        self._fetch_settings = fetch_settings
 
     def _parse(self, blob):
         leaves = {}
@@ -90,8 +88,8 @@ class MetadataMaterializer(object):
         self._md = self._materialize(self._blob, self._base_url)
         return self._md
 
-    def _fetch_url(self, url, **opts):
-        response = uh.readurl(url, **opts)
+    def _fetch_url(self, url):
+        response = util.read_file_or_url(url)
         return str(response)
 
     def _decode_leaf_blob(self, blob):
@@ -115,12 +113,12 @@ class MetadataMaterializer(object):
             child_url = combine_url(base_url, c)
             if not child_url.endswith("/"):
                 child_url += "/"
-            child_blob = self._fetch_url(child_url, **self._fetch_settings)
+            child_blob = self._fetch_url(child_url)
             child_contents[c] = self._materialize(child_blob, child_url)
         leaf_contents = {}
         for (field, resource) in leaves.items():
             leaf_url = combine_url(base_url, resource)
-            leaf_blob = self._fetch_url(leaf_url, **self._fetch_settings)
+            leaf_blob = self._fetch_url(leaf_url)
             leaf_contents[field] = self._decode_leaf_blob(leaf_blob)
         joined = {}
         joined.update(child_contents)
@@ -136,23 +134,19 @@ def get_instance_userdata(url, version='latest', ssl_details=None):
     ud_url = combine_url(url, version)
     ud_url = combine_url(ud_url, 'user-data')
     try:
-        response = uh.readurl(ud_url, timeout=5,
-                              retries=10, ssl_details=ssl_details)
+        response = util.read_file_or_url(ud_url)
         return str(response)
     except Exception:
         util.logexc(LOG, "Failed fetching userdata from url %s", ud_url)
         return None
 
 
-def get_instance_metadata(url, version='latest', ssl_details=None):
+def get_instance_metadata(url, version='latest'):
     md_url = combine_url(url, version)
     md_url = combine_url(md_url, 'meta-data')
     try:
-        response = uh.readurl(md_url, timeout=5,
-                              retries=10, ssl_details=ssl_details)
-        materializer = MetadataMaterializer(str(response), md_url,
-                                            timeout=5, retries=10,
-                                            ssl_details=ssl_details)
+        response = util.read_file_or_url(md_url)
+        materializer = MetadataMaterializer(str(response), md_url)
         return materializer.materialize()
     except Exception:
         util.logexc(LOG, "Failed fetching metadata from url %s", md_url)
diff --git a/cloudinit/sources/DataSourceEc2.py b/cloudinit/sources/DataSourceEc2.py
index 204963e7..47f677d4 100644
--- a/cloudinit/sources/DataSourceEc2.py
+++ b/cloudinit/sources/DataSourceEc2.py
@@ -137,7 +137,7 @@ class DataSourceEc2(sources.DataSource):
 
         start_time = time.time()
         url = uhelp.wait_for_url(urls=urls, max_wait=max_wait,
-                                timeout=timeout, status_cb=LOG.warn)
+                                 timeout=timeout, status_cb=LOG.warn)
 
         if url:
             LOG.debug("Using metadata source: '%s'", url2base[url])
diff --git a/cloudinit/sources/DataSourceMAAS.py b/cloudinit/sources/DataSourceMAAS.py
index e187aec9..2de31305 100644
--- a/cloudinit/sources/DataSourceMAAS.py
+++ b/cloudinit/sources/DataSourceMAAS.py
@@ -25,9 +25,11 @@ import os
 import time
 import urllib2
 
+import requests
+
 from cloudinit import log as logging
 from cloudinit import sources
-from cloudinit import url_helper as uhelp
+from cloudinit import url_helper
 from cloudinit import util
 
 LOG = logging.getLogger(__name__)
@@ -191,8 +193,8 @@ def read_maas_seed_url(seed_url, header_cb=None, timeout=None,
     version=MD_VERSION):
     """
     Read the maas datasource at seed_url.
-    header_cb is a method that should return a headers dictionary that will
-    be given to urllib2.Request()
+      - header_cb is a method that should return a headers dictionary for
+        a given url
 
     Expected format of seed_url is are the following files:
       * <seed_url>/<version>/meta-data/instance-id
@@ -220,13 +222,13 @@ def read_maas_seed_url(seed_url, header_cb=None, timeout=None,
         else:
             headers = {}
         try:
-            resp = uhelp.readurl(url, headers=headers, timeout=timeout)
-            if resp.ok():
+            resp = util.read_file_or_url(url, headers=headers, timeout=timeout)
+            if resp.ok:
                 md[name] = str(resp)
             else:
                 LOG.warn(("Fetching from %s resulted in"
-                          " an invalid http code %s"), url, resp.code)
-        except urllib2.HTTPError as e:
+                          " an invalid http code %s"), url, resp.status_code)
+        except url_helper.UrlError as e:
             if e.code != 404:
                 raise
     return check_seed_contents(md, seed_url)
diff --git a/cloudinit/url_helper.py b/cloudinit/url_helper.py
index e8330e24..0839e63b 100644
--- a/cloudinit/url_helper.py
+++ b/cloudinit/url_helper.py
@@ -58,6 +58,44 @@ def _cleanurl(url):
     return urlunparse(parsed_url)
 
 
+class UrlResponse(object):
+    def __init__(self, response):
+        self._response = response
+
+    @property
+    def contents(self):
+        return self._response.content
+
+    @property
+    def url(self):
+        return self._response.url
+
+    @property
+    def ok(self):
+        return self._response.ok
+
+    @property
+    def headers(self):
+        return self._response.headers
+
+    @property
+    def code(self):
+        return self._response.status_code
+
+    def __str__(self):
+        return self.contents
+
+
+class UrlError(IOError):
+    def __init__(self, cause):
+        IOError.__init__(self, str(cause))
+        self.cause = cause
+        if isinstance(cause, exceptions.HTTPError) and cause.response:
+            self.code = cause.response.status_code
+        else:
+            self.code = None
+
+
 def readurl(url, data=None, timeout=None, retries=0, sec_between=1,
             headers=None, ssl_details=None, check_status=True,
             allow_redirects=False):
@@ -76,6 +114,8 @@ def readurl(url, data=None, timeout=None, retries=0, sec_between=1,
             if 'cert_file' in ssl_details and 'key_file' in ssl_details:
                 req_args['cert'] = [ssl_details['cert_file'],
                                     ssl_details['key_file']]
+            elif 'cert_file' in ssl_details:
+                req_args['cert'] = str(ssl_details['cert_file'])
                                     
     req_args['allow_redirects'] = allow_redirects
     req_args['method'] = 'GET'
@@ -126,13 +166,9 @@ def readurl(url, data=None, timeout=None, retries=0, sec_between=1,
             # Doesn't seem like we can make it use a different
             # subclass for responses, so add our own backward-compat
             # attrs
-            if not hasattr(r, 'code'):
-                setattr(r, 'code', status)
-            if not hasattr(r, 'contents'):
-                setattr(r, 'contents', contents)
-            return r
+            return UrlResponse(r)
         except exceptions.RequestException as e:
-            excps.append(e)
+            excps.append(UrlError(e))
             if i + 1 < manual_tries and sec_between > 0:
                 LOG.debug("Please wait %s seconds while we wait to try again",
                           sec_between)
@@ -213,7 +249,7 @@ def wait_for_url(urls, max_wait=None, timeout=None,
                     e = ValueError(reason)
                 else:
                     return url
-            except exceptions.RequestException as e:
+            except UrlError as e:
                 reason = "request error [%s]" % e
             except Exception as e:
                 reason = "unexpected error [%s]" % e
diff --git a/cloudinit/user_data.py b/cloudinit/user_data.py
index 803ffc3a..4a640f1e 100644
--- a/cloudinit/user_data.py
+++ b/cloudinit/user_data.py
@@ -29,7 +29,6 @@ from email.mime.text import MIMEText
 
 from cloudinit import handlers
 from cloudinit import log as logging
-from cloudinit import url_helper
 from cloudinit import util
 
 LOG = logging.getLogger(__name__)
@@ -173,10 +172,10 @@ class UserDataProcessor(object):
             if include_once_on and os.path.isfile(include_once_fn):
                 content = util.load_file(include_once_fn)
             else:
-                resp = url_helper.readurl(include_url)
-                if include_once_on and resp.ok():
+                resp = util.read_file_or_url(include_url)
+                if include_once_on and resp.ok:
                     util.write_file(include_once_fn, str(resp), mode=0600)
-                if resp.ok():
+                if resp.ok:
                     content = str(resp)
                 else:
                     LOG.warn(("Fetching from %s resulted in"
diff --git a/cloudinit/util.py b/cloudinit/util.py
index f5a7ac12..da2cdeda 100644
--- a/cloudinit/util.py
+++ b/cloudinit/util.py
@@ -51,7 +51,7 @@ import yaml
 from cloudinit import importer
 from cloudinit import log as logging
 from cloudinit import safeyaml
-from cloudinit import url_helper as uhelp
+from cloudinit import url_helper
 
 from cloudinit.settings import (CFG_BUILTIN)
 
@@ -69,6 +69,18 @@ FN_ALLOWED = ('_-.()' + string.digits + string.ascii_letters)
 CONTAINER_TESTS = ['running-in-container', 'lxc-is-container']
 
 
+class FileResponse(object):
+    def __init__(self, path, contents):
+        self.code = 200
+        self.headers = {}
+        self.contents = contents
+        self.ok = True
+        self.url = path
+
+    def __str__(self):
+        return self.contents
+
+
 class ProcessExecutionError(IOError):
 
     MESSAGE_TMPL = ('%(description)s\n'
@@ -628,12 +640,53 @@ def read_optional_seed(fill, base="", ext="", timeout=5):
         raise
 
 
-def read_file_or_url(url, timeout=5, retries=10, file_retries=0):
+def fetch_ssl_details(paths=None):
+    ssl_details = {}
+    # Lookup in these locations for ssl key/cert files
+    ssl_cert_paths = [
+        '/var/lib/cloud/data/ssl',
+        '/var/lib/cloud/instance/data/ssl',
+    ]
+    if paths:
+        ssl_cert_paths.extend([
+            os.path.join(paths.get_ipath_cur('data'), 'ssl'),
+            os.path.join(paths.get_cpath('data'), 'ssl'),
+        ])
+    ssl_cert_paths = uniq_merge(ssl_cert_paths)
+    ssl_cert_paths = [d for d in ssl_cert_paths if d and os.path.isdir(d)]
+    cert_file = None
+    for d in ssl_cert_paths:
+        if os.path.isfile(os.path.join(d, 'cert.pem')):
+            cert_file = os.path.join(d, 'cert.pem')
+            break
+    key_file = None
+    for d in ssl_cert_paths:
+        if os.path.isfile(os.path.join(d, 'key.pem')):
+            key_file = os.path.join(d, 'key.pem')
+            break
+    if cert_file and key_file:
+        ssl_details['cert_file'] = cert_file
+        ssl_details['key_file'] = key_file
+    elif cert_file:
+        ssl_details['cert_file'] = cert_file
+    return ssl_details
+
+
+def read_file_or_url(url, timeout=5, retries=10,
+                     headers=None, data=None, sec_between=1, paths=None):
     if url.startswith("/"):
         url = "file://%s" % url
-    if url.startswith("file://"):
-        retries = file_retries
-    return uhelp.readurl(url, timeout=timeout, retries=retries)
+    if url.lower().startswith("file://"):
+        file_path = url[len("file://"):]
+        return FileResponse(file_path, contents=load_file(file_path))
+    else:
+        return url_helper.readurl(url,
+                                  timeout=timeout,
+                                  retries=retries,
+                                  headers=headers,
+                                  data=data,
+                                  sec_between=sec_between,
+                                  ssl_details=fetch_ssl_details(paths))
 
 
 def load_yaml(blob, default=None, allowed=(dict,)):
@@ -675,13 +728,13 @@ def read_seeded(base="", ext="", timeout=5, retries=10, file_retries=0):
 
     md_resp = read_file_or_url(md_url, timeout, retries, file_retries)
     md = None
-    if md_resp.ok():
+    if md_resp.ok:
         md_str = str(md_resp)
         md = load_yaml(md_str, default={})
 
     ud_resp = read_file_or_url(ud_url, timeout, retries, file_retries)
     ud = None
-    if ud_resp.ok():
+    if ud_resp.ok:
         ud_str = str(ud_resp)
         ud = ud_str
 
@@ -850,8 +903,8 @@ def get_cmdline_url(names=('cloud-config-url', 'url'),
     if not url:
         return (None, None, None)
 
-    resp = uhelp.readurl(url)
-    if resp.contents.startswith(starts) and resp.ok():
+    resp = read_file_or_url(url)
+    if resp.contents.startswith(starts) and resp.ok:
         return (key, url, str(resp))
 
     return (key, url, None)
-- 
cgit v1.2.3


From 9dfb60d3144860334ab1ad1d72920d962139461f Mon Sep 17 00:00:00 2001
From: harlowja <harlowja@virtualbox.rhel>
Date: Thu, 21 Feb 2013 22:39:30 -0800
Subject: More work on requests integration.

---
 cloudinit/config/cc_phone_home.py   |  3 ++-
 cloudinit/ec2_utils.py              | 17 +++++++++++------
 cloudinit/sources/DataSourceEc2.py  |  6 ++++--
 cloudinit/sources/DataSourceMAAS.py | 15 +++++++++------
 cloudinit/util.py                   |  4 ++--
 5 files changed, 28 insertions(+), 17 deletions(-)

(limited to 'cloudinit/ec2_utils.py')

diff --git a/cloudinit/config/cc_phone_home.py b/cloudinit/config/cc_phone_home.py
index 90834080..5a4332ef 100644
--- a/cloudinit/config/cc_phone_home.py
+++ b/cloudinit/config/cc_phone_home.py
@@ -112,7 +112,8 @@ def handle(name, cfg, cloud, log, args):
     url = templater.render_string(url, url_params)
     try:
         util.read_file_or_url(url, data=real_submit_keys,
-                              retries=tries, sec_between=3)
+                              retries=tries, sec_between=3,
+                              ssl_details=util.fetch_ssl_details(cloud.paths))
     except:
         util.logexc(log, ("Failed to post phone home data to"
                           " %s in %s tries"), url, tries)
diff --git a/cloudinit/ec2_utils.py b/cloudinit/ec2_utils.py
index c422eea9..026ee178 100644
--- a/cloudinit/ec2_utils.py
+++ b/cloudinit/ec2_utils.py
@@ -38,11 +38,16 @@ def combine_url(base, add_on):
 
 
 # See: http://bit.ly/TyoUQs
+#
+# Since boto metadata reader uses the old urllib which does not
+# support ssl, we need to ahead and create our own reader which
+# works the same as the boto one (for now).
 class MetadataMaterializer(object):
-    def __init__(self, blob, base_url):
+    def __init__(self, blob, base_url, ssl_details):
         self._blob = blob
         self._md = None
         self._base_url = base_url
+        self._ssl_details = ssl_details
 
     def _parse(self, blob):
         leaves = {}
@@ -89,7 +94,7 @@ class MetadataMaterializer(object):
         return self._md
 
     def _fetch_url(self, url):
-        response = util.read_file_or_url(url)
+        response = util.read_file_or_url(url, ssl_details=self._ssl_details)
         return str(response)
 
     def _decode_leaf_blob(self, blob):
@@ -134,19 +139,19 @@ def get_instance_userdata(url, version='latest', ssl_details=None):
     ud_url = combine_url(url, version)
     ud_url = combine_url(ud_url, 'user-data')
     try:
-        response = util.read_file_or_url(ud_url)
+        response = util.read_file_or_url(ud_url, ssl_details=ssl_details)
         return str(response)
     except Exception:
         util.logexc(LOG, "Failed fetching userdata from url %s", ud_url)
         return None
 
 
-def get_instance_metadata(url, version='latest'):
+def get_instance_metadata(url, version='latest', ssl_details=None):
     md_url = combine_url(url, version)
     md_url = combine_url(md_url, 'meta-data')
     try:
-        response = util.read_file_or_url(md_url)
-        materializer = MetadataMaterializer(str(response), md_url)
+        response = util.read_file_or_url(md_url, ssl_details=ssl_details)
+        materializer = MetadataMaterializer(str(response), md_url, ssl_details)
         return materializer.materialize()
     except Exception:
         util.logexc(LOG, "Failed fetching metadata from url %s", md_url)
diff --git a/cloudinit/sources/DataSourceEc2.py b/cloudinit/sources/DataSourceEc2.py
index 47f677d4..eee4e6bc 100644
--- a/cloudinit/sources/DataSourceEc2.py
+++ b/cloudinit/sources/DataSourceEc2.py
@@ -64,8 +64,10 @@ class DataSourceEc2(sources.DataSource):
             if not self.wait_for_metadata_service():
                 return False
             start_time = time.time()
-            self.userdata_raw = ec2_utils.get_instance_userdata(self.metadata_address, self.api_ver)
-            self.metadata = ec2_utils.get_instance_metadata(self.metadata_address, self.api_ver)
+            self.userdata_raw = ec2_utils.get_instance_userdata(self.metadata_address, self.api_ver,
+                                                                ssl_details=util.fetch_ssl_details(self.paths))
+            self.metadata = ec2_utils.get_instance_metadata(self.metadata_address, self.api_ver,
+                                                            ssl_details=util.fetch_ssl_details(self.paths))
             LOG.debug("Crawl of metadata service took %s seconds",
                        int(time.time() - start_time))
             return True
diff --git a/cloudinit/sources/DataSourceMAAS.py b/cloudinit/sources/DataSourceMAAS.py
index 2de31305..dc048943 100644
--- a/cloudinit/sources/DataSourceMAAS.py
+++ b/cloudinit/sources/DataSourceMAAS.py
@@ -81,7 +81,8 @@ class DataSourceMAAS(sources.DataSource):
             self.base_url = url
 
             (userdata, metadata) = read_maas_seed_url(self.base_url,
-                                                      self.md_headers)
+                                                      self.md_headers,
+                                                      paths=self.paths)
             self.userdata_raw = userdata
             self.metadata = metadata
             return True
@@ -141,7 +142,7 @@ class DataSourceMAAS(sources.DataSource):
             LOG.debug("Using metadata source: '%s'", url)
         else:
             LOG.critical("Giving up on md from %s after %i seconds",
-                            urls, int(time.time() - starttime))
+                         urls, int(time.time() - starttime))
 
         return bool(url)
 
@@ -190,7 +191,7 @@ def read_maas_seed_dir(seed_d):
 
 
 def read_maas_seed_url(seed_url, header_cb=None, timeout=None,
-    version=MD_VERSION):
+                       version=MD_VERSION, paths=None):
     """
     Read the maas datasource at seed_url.
       - header_cb is a method that should return a headers dictionary for
@@ -222,12 +223,13 @@ def read_maas_seed_url(seed_url, header_cb=None, timeout=None,
         else:
             headers = {}
         try:
-            resp = util.read_file_or_url(url, headers=headers, timeout=timeout)
+            resp = util.read_file_or_url(url, headers=headers, timeout=timeout,
+                                         ssl_details=util.fetch_ssl_details(paths))
             if resp.ok:
                 md[name] = str(resp)
             else:
                 LOG.warn(("Fetching from %s resulted in"
-                          " an invalid http code %s"), url, resp.status_code)
+                          " an invalid http code %s"), url, resp.code)
         except url_helper.UrlError as e:
             if e.code != 404:
                 raise
@@ -372,7 +374,8 @@ if __name__ == "__main__":
         if args.subcmd == "check-seed":
             if args.url.startswith("http"):
                 (userdata, metadata) = read_maas_seed_url(args.url,
-                    header_cb=my_headers, version=args.apiver)
+                                                          header_cb=my_headers,
+                                                          version=args.apiver)
             else:
                 (userdata, metadata) = read_maas_seed_url(args.url)
             print "=== userdata ==="
diff --git a/cloudinit/util.py b/cloudinit/util.py
index da2cdeda..307ed613 100644
--- a/cloudinit/util.py
+++ b/cloudinit/util.py
@@ -673,7 +673,7 @@ def fetch_ssl_details(paths=None):
 
 
 def read_file_or_url(url, timeout=5, retries=10,
-                     headers=None, data=None, sec_between=1, paths=None):
+                     headers=None, data=None, sec_between=1, ssl_details=None):
     if url.startswith("/"):
         url = "file://%s" % url
     if url.lower().startswith("file://"):
@@ -686,7 +686,7 @@ def read_file_or_url(url, timeout=5, retries=10,
                                   headers=headers,
                                   data=data,
                                   sec_between=sec_between,
-                                  ssl_details=fetch_ssl_details(paths))
+                                  ssl_details=ssl_details)
 
 
 def load_yaml(blob, default=None, allowed=(dict,)):
-- 
cgit v1.2.3


From 8fbe938228909e153afb88f189b269df60501510 Mon Sep 17 00:00:00 2001
From: Scott Moser <smoser@ubuntu.com>
Date: Tue, 19 Mar 2013 09:32:04 -0400
Subject: appease pylint and pep8

* cloudinit/distros/parsers/resolv_conf.py
  added some pylint overrides with 'plXXXXX' syntax.
  example:  # pl51222 pylint: disable=E0102

  The pl51222 there means: http://www.logilab.org/ticket/51222

  This specific issue is present in 12.04 pylint, but not 13.04.

* pylint doesn't like the requests special handling we have.
  which makes sense as it is only checking versus one specific version.
* general pep8  and pylint cleanups.
---
 cloudinit/distros/parsers/resolv_conf.py |  4 ++--
 cloudinit/ec2_utils.py                   |  1 +
 cloudinit/url_helper.py                  | 22 ++++++++++++----------
 cloudinit/util.py                        |  4 ++--
 4 files changed, 17 insertions(+), 14 deletions(-)

(limited to 'cloudinit/ec2_utils.py')

diff --git a/cloudinit/distros/parsers/resolv_conf.py b/cloudinit/distros/parsers/resolv_conf.py
index 5733c25a..1be9d46b 100644
--- a/cloudinit/distros/parsers/resolv_conf.py
+++ b/cloudinit/distros/parsers/resolv_conf.py
@@ -137,8 +137,8 @@ class ResolvConf(object):
         self._contents.append(('option', ['search', s_list, '']))
         return flat_sds
 
-    @local_domain.setter
-    def local_domain(self, domain):
+    @local_domain.setter  # pl51222 pylint: disable=E1101
+    def local_domain(self, domain):  # pl51222 pylint: disable=E0102
         self.parse()
         self._remove_option('domain')
         self._contents.append(('option', ['domain', str(domain), '']))
diff --git a/cloudinit/ec2_utils.py b/cloudinit/ec2_utils.py
index 4812eccb..6b2754aa 100644
--- a/cloudinit/ec2_utils.py
+++ b/cloudinit/ec2_utils.py
@@ -145,6 +145,7 @@ def get_instance_userdata(api_version, metadata_address, ssl_details=None):
         util.logexc(LOG, "Failed fetching userdata from url %s", ud_url)
         return None
 
+
 def get_instance_metadata(api_version, metadata_address, ssl_details=None):
     md_url = combine_url(metadata_address, api_version)
     md_url = combine_url(md_url, 'meta-data')
diff --git a/cloudinit/url_helper.py b/cloudinit/url_helper.py
index bfc5cfdd..de73cc84 100644
--- a/cloudinit/url_helper.py
+++ b/cloudinit/url_helper.py
@@ -34,12 +34,12 @@ LOG = logging.getLogger(__name__)
 
 # Check if requests has ssl support (added in requests >= 0.8.8)
 SSL_ENABLED = False
-CONFIG_ENABLED = False # This was added in 0.7 (but taken out in >=1.0)
+CONFIG_ENABLED = False  # This was added in 0.7 (but taken out in >=1.0)
 try:
-    import pkg_resources
     from distutils.version import LooseVersion
+    import pkg_resources
     _REQ = pkg_resources.get_distribution('requests')
-    _REQ_VER = LooseVersion(_REQ.version)
+    _REQ_VER = LooseVersion(_REQ.version)  # pylint: disable=E1103
     if _REQ_VER >= LooseVersion('0.8.8'):
         SSL_ENABLED = True
     if _REQ_VER >= LooseVersion('0.7.0') and _REQ_VER < LooseVersion('1.0.0'):
@@ -49,7 +49,7 @@ except:
 
 
 def _cleanurl(url):
-    parsed_url = list(urlparse(url, scheme='http'))
+    parsed_url = list(urlparse(url, scheme='http'))  # pylint: disable=E1123
     if not parsed_url[1] and parsed_url[2]:
         # Swap these since this seems to be a common
         # occurrence when given urls like 'www.google.com'
@@ -108,7 +108,8 @@ def readurl(url, data=None, timeout=None, retries=0, sec_between=1,
     req_args = {
         'url': url,
     }
-    if urlparse(url).scheme == 'https' and ssl_details:
+    scheme = urlparse(url).scheme  # pylint: disable=E1101
+    if scheme == 'https' and ssl_details:
         if not SSL_ENABLED:
             LOG.warn("SSL is not enabled, cert. verification can not occur!")
         else:
@@ -121,7 +122,7 @@ def readurl(url, data=None, timeout=None, retries=0, sec_between=1,
                                     ssl_details['key_file']]
             elif 'cert_file' in ssl_details:
                 req_args['cert'] = str(ssl_details['cert_file'])
-                                    
+
     req_args['allow_redirects'] = allow_redirects
     req_args['method'] = 'GET'
     if timeout is not None:
@@ -162,16 +163,17 @@ def readurl(url, data=None, timeout=None, retries=0, sec_between=1,
         try:
             r = requests.request(**req_args)
             if check_status:
-                r.raise_for_status()
+                r.raise_for_status()  # pylint: disable=E1103
             LOG.debug("Read from %s (%s, %sb) after %s attempts", url,
-                      r.status_code, len(r.content), (i + 1))
+                      r.status_code, len(r.content),  # pylint: disable=E1103
+                      (i + 1))
             # Doesn't seem like we can make it use a different
             # subclass for responses, so add our own backward-compat
             # attrs
             return UrlResponse(r)
         except exceptions.RequestException as e:
             if (isinstance(e, (exceptions.HTTPError))
-                and hasattr(e, 'response') # This appeared in v 0.10.8
+                and hasattr(e, 'response')  # This appeared in v 0.10.8
                 and e.response):
                 excps.append(UrlError(e, code=e.response.status_code,
                                       headers=e.response.headers))
@@ -183,7 +185,7 @@ def readurl(url, data=None, timeout=None, retries=0, sec_between=1,
                 time.sleep(sec_between)
     if excps:
         raise excps[-1]
-    return None # Should throw before this...
+    return None  # Should throw before this...
 
 
 def wait_for_url(urls, max_wait=None, timeout=None,
diff --git a/cloudinit/util.py b/cloudinit/util.py
index 52b528ea..36e9b83b 100644
--- a/cloudinit/util.py
+++ b/cloudinit/util.py
@@ -51,8 +51,8 @@ from cloudinit import importer
 from cloudinit import log as logging
 from cloudinit import mergers
 from cloudinit import safeyaml
-from cloudinit import url_helper
 from cloudinit import type_utils
+from cloudinit import url_helper
 from cloudinit import version
 
 from cloudinit.settings import (CFG_BUILTIN)
@@ -81,7 +81,7 @@ class StringResponse(object):
         self.contents = contents
         self.url = None
 
-    def ok(self, *args, **kwargs):
+    def ok(self, *args, **kwargs):  # pylint: disable=W0613
         if self.code != 200:
             return False
         return True
-- 
cgit v1.2.3


From 0d325536ea06a8511da04f57260ab08e8b4786d9 Mon Sep 17 00:00:00 2001
From: Scott Moser <smoser@ubuntu.com>
Date: Tue, 19 Mar 2013 10:35:13 -0400
Subject: make get_instance_userdata and get_instance_metadata more like botos

this shouldn't change anything, only the signatures of the methods.
---
 cloudinit/ec2_utils.py | 13 ++++++++-----
 1 file changed, 8 insertions(+), 5 deletions(-)

(limited to 'cloudinit/ec2_utils.py')

diff --git a/cloudinit/ec2_utils.py b/cloudinit/ec2_utils.py
index 6b2754aa..87644c40 100644
--- a/cloudinit/ec2_utils.py
+++ b/cloudinit/ec2_utils.py
@@ -135,8 +135,9 @@ class MetadataMaterializer(object):
         return joined
 
 
-def get_instance_userdata(api_version, metadata_address, ssl_details=None):
-    ud_url = combine_url(metadata_address, api_version)
+def get_instance_userdata(version='latest', url='http://169.254.169.254',
+                          ssl_details=None):
+    ud_url = combine_url(url, version)
     ud_url = combine_url(ud_url, 'user-data')
     try:
         response = util.read_file_or_url(ud_url, ssl_details=ssl_details)
@@ -146,11 +147,13 @@ def get_instance_userdata(api_version, metadata_address, ssl_details=None):
         return None
 
 
-def get_instance_metadata(api_version, metadata_address, ssl_details=None):
-    md_url = combine_url(metadata_address, api_version)
+def get_instance_metadata(version='latest', url='http://169.254.169.254',
+                          ssl_details=None, timeout=5, num_retries=5)
+    md_url = combine_url(metadata_address, version)
     md_url = combine_url(md_url, 'meta-data')
     try:
-        response = util.read_file_or_url(md_url, ssl_details=ssl_details)
+        response = util.read_file_or_url(md_url, ssl_details=ssl_details,
+                                         timeout=timeout, retries=num_retries)
         materializer = MetadataMaterializer(str(response), md_url, ssl_details)
         return materializer.materialize()
     except Exception:
-- 
cgit v1.2.3


From 5f3aaf5300825a3e586c9369aa4c1d917b448811 Mon Sep 17 00:00:00 2001
From: Scott Moser <smoser@ubuntu.com>
Date: Tue, 19 Mar 2013 11:12:59 -0400
Subject: fix typo

---
 cloudinit/ec2_utils.py | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

(limited to 'cloudinit/ec2_utils.py')

diff --git a/cloudinit/ec2_utils.py b/cloudinit/ec2_utils.py
index 87644c40..71c84206 100644
--- a/cloudinit/ec2_utils.py
+++ b/cloudinit/ec2_utils.py
@@ -148,7 +148,7 @@ def get_instance_userdata(version='latest', url='http://169.254.169.254',
 
 
 def get_instance_metadata(version='latest', url='http://169.254.169.254',
-                          ssl_details=None, timeout=5, num_retries=5)
+                          ssl_details=None, timeout=5, num_retries=5):
     md_url = combine_url(metadata_address, version)
     md_url = combine_url(md_url, 'meta-data')
     try:
-- 
cgit v1.2.3


From 20a2d9961697fbd6ef0e74cd3770b6601b141bcd Mon Sep 17 00:00:00 2001
From: Joshua Harlow <harlowja@yahoo-inc.com>
Date: Tue, 19 Mar 2013 15:53:16 -0700
Subject: Move back to using boto for now.

---
 Requires                                  |   3 +
 cloudinit/ec2_utils.py                    | 183 +++++++-----------------------
 cloudinit/sources/DataSourceCloudStack.py |   7 +-
 cloudinit/sources/DataSourceEc2.py        |   7 +-
 4 files changed, 48 insertions(+), 152 deletions(-)

(limited to 'cloudinit/ec2_utils.py')

diff --git a/Requires b/Requires
index 0313d569..de51a4e4 100644
--- a/Requires
+++ b/Requires
@@ -24,3 +24,6 @@ argparse
 
 # Requests handles ssl correctly!
 requests
+
+# Boto for ec2
+boto
diff --git a/cloudinit/ec2_utils.py b/cloudinit/ec2_utils.py
index 71c84206..29393ce1 100644
--- a/cloudinit/ec2_utils.py
+++ b/cloudinit/ec2_utils.py
@@ -16,146 +16,45 @@
 #    You should have received a copy of the GNU General Public License
 #    along with this program.  If not, see <http://www.gnu.org/licenses/>.
 
-from urlparse import (urlparse, urlunparse)
+import boto.utils as boto_utils
+
+# Versions of boto >= 2.6.0 (and possibly 2.5.2)
+# try to lazily load the metadata backing, which
+# doesn't work so well in cloud-init especially
+# since the metadata is serialized and actions are
+# performed where the metadata server may be blocked
+# (thus the datasource will start failing) resulting
+# in url exceptions when fields that do exist (or
+# would have existed) do not exist due to the blocking
+# that occurred.
+
+
+def _unlazy_dict(mp):
+    if not isinstance(mp, (dict)):
+        return mp
+    # Walk over the keys/values which
+    # forces boto to unlazy itself and
+    # has no effect on dictionaries that
+    # already have there items.
+    for (_k, v) in mp.items():
+        _unlazy_dict(v)
+    return mp
+
+
+def get_instance_userdata(api_version, metadata_address):
+    # Note: boto.utils.get_instance_metadata returns '' for empty string
+    # so the change from non-true to '' is not specifically necessary, but
+    # this way cloud-init will get consistent behavior even if boto changed
+    # in the future to return a None on "no user-data provided".
+    ud = boto_utils.get_instance_userdata(api_version, None, metadata_address)
+    if not ud:
+        ud = ''
+    return ud
+
+
+def get_instance_metadata(api_version, metadata_address):
+    metadata = boto_utils.get_instance_metadata(api_version, metadata_address)
+    if not isinstance(metadata, (dict)):
+        metadata = {}
+    return _unlazy_dict(metadata)
 
-import json
-import urllib
-
-from cloudinit import log as logging
-from cloudinit import util
-
-LOG = logging.getLogger(__name__)
-
-
-def combine_url(base, add_on):
-    base_parsed = list(urlparse(base))
-    path = base_parsed[2]
-    if path and not path.endswith("/"):
-        path += "/"
-    path += urllib.quote(str(add_on), safe="/:")
-    base_parsed[2] = path
-    return urlunparse(base_parsed)
-
-
-# See: http://bit.ly/TyoUQs
-#
-# Since boto metadata reader uses the old urllib which does not
-# support ssl, we need to ahead and create our own reader which
-# works the same as the boto one (for now).
-class MetadataMaterializer(object):
-    def __init__(self, blob, base_url, ssl_details):
-        self._blob = blob
-        self._md = None
-        self._base_url = base_url
-        self._ssl_details = ssl_details
-
-    def _parse(self, blob):
-        leaves = {}
-        children = []
-        if not blob:
-            return (leaves, children)
-
-        def has_children(item):
-            if item.endswith("/"):
-                return True
-            else:
-                return False
-
-        def get_name(item):
-            if item.endswith("/"):
-                return item.rstrip("/")
-            return item
-
-        for field in blob.splitlines():
-            field = field.strip()
-            field_name = get_name(field)
-            if not field or not field_name:
-                continue
-            if has_children(field):
-                if field_name not in children:
-                    children.append(field_name)
-            else:
-                contents = field.split("=", 1)
-                resource = field_name
-                if len(contents) > 1:
-                    # What a PITA...
-                    (ident, sub_contents) = contents
-                    checked_ident = util.safe_int(ident)
-                    if checked_ident is not None:
-                        resource = "%s/openssh-key" % (checked_ident)
-                        field_name = sub_contents
-                leaves[field_name] = resource
-        return (leaves, children)
-
-    def materialize(self):
-        if self._md is not None:
-            return self._md
-        self._md = self._materialize(self._blob, self._base_url)
-        return self._md
-
-    def _fetch_url(self, url):
-        response = util.read_file_or_url(url, ssl_details=self._ssl_details)
-        return str(response)
-
-    def _decode_leaf_blob(self, blob):
-        if not blob:
-            return blob
-        stripped_blob = blob.strip()
-        if stripped_blob.startswith("{") and stripped_blob.endswith("}"):
-            # Assume and try with json
-            try:
-                return json.loads(blob)
-            except (ValueError, TypeError):
-                pass
-        if blob.find("\n") != -1:
-            return blob.splitlines()
-        return blob
-
-    def _materialize(self, blob, base_url):
-        (leaves, children) = self._parse(blob)
-        child_contents = {}
-        for c in children:
-            child_url = combine_url(base_url, c)
-            if not child_url.endswith("/"):
-                child_url += "/"
-            child_blob = self._fetch_url(child_url)
-            child_contents[c] = self._materialize(child_blob, child_url)
-        leaf_contents = {}
-        for (field, resource) in leaves.items():
-            leaf_url = combine_url(base_url, resource)
-            leaf_blob = self._fetch_url(leaf_url)
-            leaf_contents[field] = self._decode_leaf_blob(leaf_blob)
-        joined = {}
-        joined.update(child_contents)
-        for field in leaf_contents.keys():
-            if field in joined:
-                LOG.warn("Duplicate key found in results from %s", base_url)
-            else:
-                joined[field] = leaf_contents[field]
-        return joined
-
-
-def get_instance_userdata(version='latest', url='http://169.254.169.254',
-                          ssl_details=None):
-    ud_url = combine_url(url, version)
-    ud_url = combine_url(ud_url, 'user-data')
-    try:
-        response = util.read_file_or_url(ud_url, ssl_details=ssl_details)
-        return str(response)
-    except Exception:
-        util.logexc(LOG, "Failed fetching userdata from url %s", ud_url)
-        return None
-
-
-def get_instance_metadata(version='latest', url='http://169.254.169.254',
-                          ssl_details=None, timeout=5, num_retries=5):
-    md_url = combine_url(metadata_address, version)
-    md_url = combine_url(md_url, 'meta-data')
-    try:
-        response = util.read_file_or_url(md_url, ssl_details=ssl_details,
-                                         timeout=timeout, retries=num_retries)
-        materializer = MetadataMaterializer(str(response), md_url, ssl_details)
-        return materializer.materialize()
-    except Exception:
-        util.logexc(LOG, "Failed fetching metadata from url %s", md_url)
-        return None
diff --git a/cloudinit/sources/DataSourceCloudStack.py b/cloudinit/sources/DataSourceCloudStack.py
index 7fd38982..b4ca6d93 100644
--- a/cloudinit/sources/DataSourceCloudStack.py
+++ b/cloudinit/sources/DataSourceCloudStack.py
@@ -102,13 +102,10 @@ class DataSourceCloudStack(sources.DataSource):
                 return False
             start_time = time.time()
             md_addr = self.metadata_address
-            ssl_details = util.fetch_ssl_details(self.paths)
             self.userdata_raw = ec2_utils.get_instance_userdata(self.api_ver,
-                                                                md_addr,
-                                                                ssl_details)
+                                                                md_addr)
             self.metadata = ec2_utils.get_instance_metadata(self.api_ver,
-                                                            md_addr,
-                                                            ssl_details)
+                                                            md_addr)
             LOG.debug("Crawl of metadata service took %s seconds",
                       int(time.time() - start_time))
             return True
diff --git a/cloudinit/sources/DataSourceEc2.py b/cloudinit/sources/DataSourceEc2.py
index 0d62cf01..bd35c8b0 100644
--- a/cloudinit/sources/DataSourceEc2.py
+++ b/cloudinit/sources/DataSourceEc2.py
@@ -62,13 +62,10 @@ class DataSourceEc2(sources.DataSource):
                 return False
             start_time = time.time()
             md_addr = self.metadata_address
-            ssl_details = util.fetch_ssl_details(self.paths)
             self.userdata_raw = ec2_utils.get_instance_userdata(self.api_ver,
-                                                                md_addr,
-                                                                ssl_details)
+                                                                md_addr)
             self.metadata = ec2_utils.get_instance_metadata(self.api_ver,
-                                                            md_addr,
-                                                            ssl_details)
+                                                            md_addr)
             LOG.debug("Crawl of metadata service took %s seconds",
                        int(time.time() - start_time))
             return True
-- 
cgit v1.2.3


From 1c88411ed2692f2dacb0c6e15f27b8dca64e7089 Mon Sep 17 00:00:00 2001
From: Joshua Harlow <harlowja@yahoo-inc.com>
Date: Tue, 19 Mar 2013 15:55:58 -0700
Subject: Add doc about issue 1401 in boto.

---
 cloudinit/ec2_utils.py | 4 ++++
 1 file changed, 4 insertions(+)

(limited to 'cloudinit/ec2_utils.py')

diff --git a/cloudinit/ec2_utils.py b/cloudinit/ec2_utils.py
index 29393ce1..175f96aa 100644
--- a/cloudinit/ec2_utils.py
+++ b/cloudinit/ec2_utils.py
@@ -28,6 +28,10 @@ import boto.utils as boto_utils
 # would have existed) do not exist due to the blocking
 # that occurred.
 
+# TODO: https://github.com/boto/boto/issues/1401
+# When boto finally moves to using requests, we should be able
+# to provide it ssl details, it does not yet, so we can't provide them...
+
 
 def _unlazy_dict(mp):
     if not isinstance(mp, (dict)):
-- 
cgit v1.2.3


From c49b92e2e1f32cbb32c856ba246ef97026318dbf Mon Sep 17 00:00:00 2001
From: Scott Moser <smoser@ubuntu.com>
Date: Wed, 20 Mar 2013 08:30:43 -0400
Subject: remove some churn

cloudinit/sources/DataSourceCloudStack.py and
cloudinit/sources/DataSourceEc2.py are reverted entirely back to trunk versions
now, rather than the non-behavior change that was left in place.

Also, remove inadvertantly added trailing newline from cloudinit/ec2_utils.py

Overall, this just makes the diff when merged to trunk carry more focused
changes.
---
 cloudinit/ec2_utils.py                    |  1 -
 cloudinit/sources/DataSourceCloudStack.py | 11 +++++------
 cloudinit/sources/DataSourceEc2.py        | 13 ++++++-------
 3 files changed, 11 insertions(+), 14 deletions(-)

(limited to 'cloudinit/ec2_utils.py')

diff --git a/cloudinit/ec2_utils.py b/cloudinit/ec2_utils.py
index 175f96aa..5fa8c5ad 100644
--- a/cloudinit/ec2_utils.py
+++ b/cloudinit/ec2_utils.py
@@ -61,4 +61,3 @@ def get_instance_metadata(api_version, metadata_address):
     if not isinstance(metadata, (dict)):
         metadata = {}
     return _unlazy_dict(metadata)
-
diff --git a/cloudinit/sources/DataSourceCloudStack.py b/cloudinit/sources/DataSourceCloudStack.py
index b4ca6d93..81c8cda9 100644
--- a/cloudinit/sources/DataSourceCloudStack.py
+++ b/cloudinit/sources/DataSourceCloudStack.py
@@ -25,7 +25,7 @@
 import os
 import time
 
-from cloudinit import ec2_utils
+from cloudinit import ec2_utils as ec2
 from cloudinit import log as logging
 from cloudinit import sources
 from cloudinit import url_helper as uhelp
@@ -101,11 +101,10 @@ class DataSourceCloudStack(sources.DataSource):
             if not self.wait_for_metadata_service():
                 return False
             start_time = time.time()
-            md_addr = self.metadata_address
-            self.userdata_raw = ec2_utils.get_instance_userdata(self.api_ver,
-                                                                md_addr)
-            self.metadata = ec2_utils.get_instance_metadata(self.api_ver,
-                                                            md_addr)
+            self.userdata_raw = ec2.get_instance_userdata(self.api_ver,
+                self.metadata_address)
+            self.metadata = ec2.get_instance_metadata(self.api_ver,
+                                                      self.metadata_address)
             LOG.debug("Crawl of metadata service took %s seconds",
                       int(time.time() - start_time))
             return True
diff --git a/cloudinit/sources/DataSourceEc2.py b/cloudinit/sources/DataSourceEc2.py
index bd35c8b0..f010e640 100644
--- a/cloudinit/sources/DataSourceEc2.py
+++ b/cloudinit/sources/DataSourceEc2.py
@@ -23,7 +23,7 @@
 import os
 import time
 
-from cloudinit import ec2_utils
+from cloudinit import ec2_utils as ec2
 from cloudinit import log as logging
 from cloudinit import sources
 from cloudinit import url_helper as uhelp
@@ -61,11 +61,10 @@ class DataSourceEc2(sources.DataSource):
             if not self.wait_for_metadata_service():
                 return False
             start_time = time.time()
-            md_addr = self.metadata_address
-            self.userdata_raw = ec2_utils.get_instance_userdata(self.api_ver,
-                                                                md_addr)
-            self.metadata = ec2_utils.get_instance_metadata(self.api_ver,
-                                                            md_addr)
+            self.userdata_raw = ec2.get_instance_userdata(self.api_ver,
+                self.metadata_address)
+            self.metadata = ec2.get_instance_metadata(self.api_ver,
+                                                      self.metadata_address)
             LOG.debug("Crawl of metadata service took %s seconds",
                        int(time.time() - start_time))
             return True
@@ -134,7 +133,7 @@ class DataSourceEc2(sources.DataSource):
 
         start_time = time.time()
         url = uhelp.wait_for_url(urls=urls, max_wait=max_wait,
-                                 timeout=timeout, status_cb=LOG.warn)
+                                timeout=timeout, status_cb=LOG.warn)
 
         if url:
             LOG.debug("Using metadata source: '%s'", url2base[url])
-- 
cgit v1.2.3


From ab71760d7e127ae9a3cf31a4f6d7600c945f0dd7 Mon Sep 17 00:00:00 2001
From: Scott Moser <smoser@ubuntu.com>
Date: Wed, 20 Mar 2013 08:34:19 -0400
Subject: pep8

---
 cloudinit/ec2_utils.py | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

(limited to 'cloudinit/ec2_utils.py')

diff --git a/cloudinit/ec2_utils.py b/cloudinit/ec2_utils.py
index 5fa8c5ad..fcd511c5 100644
--- a/cloudinit/ec2_utils.py
+++ b/cloudinit/ec2_utils.py
@@ -28,7 +28,7 @@ import boto.utils as boto_utils
 # would have existed) do not exist due to the blocking
 # that occurred.
 
-# TODO: https://github.com/boto/boto/issues/1401
+# TODO(harlowja): https://github.com/boto/boto/issues/1401
 # When boto finally moves to using requests, we should be able
 # to provide it ssl details, it does not yet, so we can't provide them...
 
-- 
cgit v1.2.3