X-Git-Url: http://git.veekun.com/zzz-pokedex.git/blobdiff_plain/c1ba23b0c45a0873cd27456c0950c7f4f3253fe4..00e0bf75c998b9d9c743d383f1596c91f9a03766:/pokedex/db/__init__.py

diff --git a/pokedex/db/__init__.py b/pokedex/db/__init__.py
index e2790da..ae06c1b 100644
--- a/pokedex/db/__init__.py
+++ b/pokedex/db/__init__.py
@@ -1,7 +1,10 @@
-from sqlalchemy import MetaData, Table, engine_from_config, orm
+# encoding: utf-8
+import re
+
+from sqlalchemy import engine_from_config, orm
 
 from ..defaults import get_default_db_uri
-from .tables import metadata
+from .tables import Language, metadata
 from .multilang import MultilangSession, MultilangScopedSession
 
 
@@ -21,7 +24,7 @@ def connect(uri=None, session_args={}, engine_args={}, engine_prefix=''):
         uri = get_default_db_uri()
 
     ### Do some fixery for MySQL
-    if uri[0:5] == 'mysql':
+    if uri.startswith('mysql:'):
         # MySQL uses latin1 for connections by default even if the server is
         # otherwise oozing with utf8; charset fixes this
         if 'charset' not in uri:
@@ -41,7 +44,43 @@ def connect(uri=None, session_args={}, engine_args={}, engine_prefix=''):
 
     all_session_args = dict(autoflush=True, autocommit=False, bind=engine)
     all_session_args.update(session_args)
-    sm = orm.sessionmaker(class_=MultilangSession, **all_session_args)
+    sm = orm.sessionmaker(class_=MultilangSession, language_class=Language,
+        **all_session_args)
     session = MultilangScopedSession(sm)
 
+    # Default to English.  Warning, magic constant, blah blah.  Trying to fetch
+    # English here would kinda break on new databases.  TODO still not an ideal
+    # solution, I guess.
+    session._default_language_id = 9
+
     return session
+
+def identifier_from_name(name):
+    """Make a string safe to use as an identifier.
+
+    Valid characters are lowercase alphanumerics and "-". This function may
+    raise ValueError if it can't come up with a suitable identifier.
+
+    This function is useful for scripts which add things with names.
+    """
+    if isinstance(name, str):
+        identifier = name.decode('utf-8')
+    else:
+        identifier = name
+    identifier = identifier.lower()
+    identifier = identifier.replace(u'+', u' plus ')
+    identifier = re.sub(u'[ _â]+', u'-', identifier)
+    identifier = re.sub(u"['./;â(),:]", u'', identifier)
+    identifier = identifier.replace(u'Ã©', u'e')
+    identifier = identifier.replace(u'â', u'-f')
+    identifier = identifier.replace(u'â', u'-m')
+    if identifier in (u'???', u'????'):
+        identifier = u'unknown'
+    elif identifier == u'!':
+        identifier = u'exclamation'
+    elif identifier == u'?':
+        identifier = u'question'
+
+    if not identifier.replace(u"-", u"").isalnum():
+        raise ValueError(identifier)
+    return identifier