Am 08.09.2010 08:31, schrieb Marc Bastian Heinrichs:
Ein Unterschied fürs Deutsche zwischen
utf8_general_ci und utf8_unicode_ci besteht lediglich beim ß.

utf8_general_ci: ß = s / utf8_unicode_ci: ß = ss

Die Umlaute werden gleich behandelt und daher das Ä auch bei
utf8_general_ci bei A einsortiert. Entspricht auch der eigenen Erfahrung
und ist nachlesbar unter
http://dev.mysql.com/doc/refman/5.1/de/charset-unicode-sets.html

Wenn dies in Kauf genommen werden kann, sollte also utf8_general_ci
benutzt werden, weil die benutzte Sortierfolge schneller ist.

Hallo Marc Bastian,

danke für den Hinweis und den Link.
Bei der Sortierung habe ich mich bzgl. der deutschen Umlaute geirrt - sorry.

Wenn's um Abwägung zwischen Performance und Qualität geht ist sicher die Art und Anzahl der Sprachen nicht ganz unerheblich, die in der Datenbank gespeichert werden sollen - bei einsprachigen Websites reicht ja auch ein ASCII-Setup.

Folgendes wollte ich noch erwähnen, auch falls es Allen klar sein sollte:
Ich habe keinen Hinweis darauf gefunden, daß Ä wie Ae interpretiert wird.
Das ist generell bei fehler-, bzw. schreibweisentoleranter Sortierung zu berücksichtigen weil sich daraus folgendes Bild, nämlich daß für die adäquaten Schreibweisen Ä und AE an zwei verschiedenen Stellen gesucht werden muß und hier scheinbar generell keine Übereinstimmung in Unicode gemappt wird:

AA
...
AAD
AAE
AAF
...
AÄ
...
AD
AE
AF
...
AY
AZ
...
ÄA
ÄÄ
...
ÄAD
ÄAE
ÄAF
...
ÄD
ÄE
ÄF
...
ÄZ


Gruß,
David

_______________________________________________
TYPO3-german mailing list
TYPO3-german@lists.typo3.org
http://lists.typo3.org/cgi-bin/mailman/listinfo/typo3-german

Antwort per Email an