Seite 1 von 1
Akzentierte Zeichen (Umlaute usw.) nicht in Entities encoden
Verfasst: Mo 16. Jun 2008, 21:52
von kleena
Hallo,
ich setze eine Webseite mit Contenido auf und habe mit ein paa Problemen zu kämpfen.
Eins davon ist, dass in der Ausgabe alle Sonderzeichen, deutsche Umlaute und Ähnliche, in HTML-Entities umkodiert werden (ü usw.). Ich habe schon die Sprache in UTF-8 geändert, in der Hoffnung, dass dies wegen des Latin-1 Encodings passiert. Leider wird in meinem UTF-8 genauso umcodiert.
Auf der Contenido-Homepage sehe ich aber wunderschöne Umlaute...
Kann man das Umcoden der Ausgabe irgendwo umschalten, oder liegt es vielleicht an falscher Einstellung des Datenbank-Encodings...?
Danke vielmals,
kleena k.
Verfasst: Mo 16. Jun 2008, 22:33
von holger.librenz_4fb
Hallo kleena.
Wieso willst Du dieses valide HTML Enkodieren ausschalten? Egal welches Encoding gewählt ist, Sonderzeichen und Umlaute gehören für HTML entsprechend enkodiert.
Wenn Du es für eine Ausgabe brauchst, die nicht HTML ist, kannst Du die Enkodierung natürlich entsprechend umkehren respektive gar nicht erst einbauen
So long,
Holger
Verfasst: Mo 16. Jun 2008, 22:43
von kleena
...und ich dachte immer, im HTML darf alles vorkommen, was nach dem gewählten Encoding Text ist. In Latin 1 sind deutsche Umlaute völlig legal, in UTF-8 auch z.B. kyrillische Zeichen.
Purismus hier oder da - ja, ich möchte, dass solche Zeichen nicht encoded werden, so, wie es (meiner Meinung nach) die Suchmaschinen und auch Menschen beim Suchen mögen. Ein "ü" oder "ß" soll genauso ausgegeben werden.
Um die Encodierung geht es mir eben - wo steckt sie drin, ist sie immer aktiv? Wie gesagt - z.B. die Contenido-Website klann das, so nehme ich an, es ist mit Contenido möglich.
Danke

Verfasst: Di 17. Jun 2008, 06:13
von holger.librenz_4fb
Du handelst Dir damit allerdings nur Probleme ein. Diese Enkodierung ist zum Beispiel für die Rechner gedacht, die schlichtweg Deine Sonderzeichen nicht anzeigen können. Ansonsten verhalten sich ü und ü äquivalent zueinander - sowohl Suchmaschinen als auch Browser erlauben Dir eine (ausschliessliche) Suche nach "ü". Eine andere Sache ist die Enkodierung in HTML Attributen und JavaScript, hier müssen - wenn überhaupt - diese unkodiert erscheinen.
Wenn es aber unbedingt nicht standardkonform sein soll: Die Enkodierung geschieht durch den Tiny und teilweise durch Postprocessing im Contenido. Du könntest in den entsprechenden Modulen ein
html_entity_decode() benutzen um sie wieder herauszufiltern. Ich kann davon aber nur abraten!
kleena hat geschrieben:Wie gesagt - z.B. die Contenido-Website klann das
Hmm, hilf mir kurz schauen - wo ist denn auf der contenido.org ein nicht enkodiertes Sonderzeichen?
So long,
Holger
Verfasst: Di 17. Jun 2008, 09:45
von kleena
holger.librenz_4fb hat geschrieben:Du handelst Dir damit allerdings nur Probleme ein. Diese Enkodierung ist zum Beispiel für die Rechner gedacht, die schlichtweg Deine Sonderzeichen nicht anzeigen können. Ansonsten verhalten sich ü und ü äquivalent zueinander
Ich kann die Gründe dafür verstehen, alllerdings ist mir nicht bewusst, dass dies durch den Standard vorgeschrieben wäre, vielmehr halten es schlicht manche für "best practice". Ich selbst halte nicht viel davon, denn nimmt man an, dies wäre der Fall, würde z.B. UTF-8 im HTML keinen Sinn haben, weil man ja ohnehin alles in Entities umwandeln müsste. Wozu dann UTF-8, um reines ASCII auszudrücken? Darüber hinaus, ist dies der Fall und habe ich meine Templates voller Entity-Kodi, wie suche ich dann nach dem Wort "Köter"? Muss ich dann jedesmal auch die Entity eintippen? Oder soll das der Editor können? Welcher kann das?
holger.librenz_4fb hat geschrieben:
kleena hat geschrieben:Wie gesagt - z.B. die Contenido-Website klann das
Hmm, hilf mir kurz schauen - wo ist denn auf der contenido.org ein nicht enkodiertes Sonderzeichen?
Das muss ich zurücknemhen, Du hast Recht. Gestern war ich mir sicher es dort gesehen zu haben, jetzt wieder nicht mehr. Trotzdem, Contenido-Sites und AfterBuy sind die Einzigen, die heute noch sowas machen. Ich arbeite lange genug im Web-Development und eine Information, dies wäre vorteilhafter oder sogar lt. Standard erforderlich, ist mir in den moderneren Zeiten noch nicht über den Weg gekommen.
Ich verstehe Dich also so, dass sowas in Contenido wohl nicht voeregesen ist, wenn man es haben möchte, müsste man entsprechende Stellen finden und "verstümmeln". Richtig?
Danke.
Verfasst: Mo 11. Aug 2008, 09:08
von mko
Ich stehe vor einem ähnlichen Problem - Contenido 4.8.6 enkodiert einige Seiten und einige nicht. Daraus resultiert ein großes Problem bei der Suche bzw. beim Ergebnis der Suche. Ergebnisse in denen die Sonderzeichen enkodet werden, werden richtig angezeigt andere eben nicht.
Wir erstellen alle Seiten im UTF-8 Format und das in mehr als 20 Sprachen - wie können wir dieses Such/Find Problem lösen?
Verfasst: Mi 27. Aug 2008, 21:29
von derSteffen
Mhm,
leider habe ich das Problem mit den UTF-8 jetzt auch und im Zuge von AJAX welches ja UTF-8 Ergebnisse liefert müßte man das doch irgendwie hinbekommen.
MfG Steffen