Am 08.09.2010 08:31, schrieb Marc Bastian Heinrichs:
Ein Unterschied fürs Deutsche zwischen
utf8_general_ci und utf8_unicode_ci besteht lediglich beim ß.
utf8_general_ci: ß = s / utf8_unicode_ci: ß = ss
Die Umlaute werden gleich behandelt und daher das Ä auch bei
utf8_general_ci bei A einsortiert. Entspricht auch der eigenen Erfahrung
und ist nachlesbar unter
http://dev.mysql.com/doc/refman/5.1/de/charset-unicode-sets.html
Wenn dies in Kauf genommen werden kann, sollte also utf8_general_ci
benutzt werden, weil die benutzte Sortierfolge schneller ist.
Hallo Marc Bastian,
danke für den Hinweis und den Link.
Bei der Sortierung habe ich mich bzgl. der deutschen Umlaute geirrt - sorry.
Wenn's um Abwägung zwischen Performance und Qualität geht ist sicher die
Art und Anzahl der Sprachen nicht ganz unerheblich, die in der Datenbank
gespeichert werden sollen - bei einsprachigen Websites reicht ja auch
ein ASCII-Setup.
Folgendes wollte ich noch erwähnen, auch falls es Allen klar sein sollte:
Ich habe keinen Hinweis darauf gefunden, daß Ä wie Ae interpretiert wird.
Das ist generell bei fehler-, bzw. schreibweisentoleranter Sortierung zu
berücksichtigen weil sich daraus folgendes Bild, nämlich daß für die
adäquaten Schreibweisen Ä und AE an zwei verschiedenen Stellen gesucht
werden muß und hier scheinbar generell keine Übereinstimmung in Unicode
gemappt wird:
AA
...
AAD
AAE
AAF
...
AÄ
...
AD
AE
AF
...
AY
AZ
...
ÄA
ÄÄ
...
ÄAD
ÄAE
ÄAF
...
ÄD
ÄE
ÄF
...
ÄZ
Gruß,
David
_______________________________________________
TYPO3-german mailing list
TYPO3-german@lists.typo3.org
http://lists.typo3.org/cgi-bin/mailman/listinfo/typo3-german