Down with Unicode! Why 16 bits per character is a right pain in the ASCII

Fri, 25 Oct 2013 11:26:45 +1100

Andrew Pam <xanni [at] glasswings.com.au>

Andrew Pam
http://www.theregister.co.uk/2013/10/04/verity_stob_unicode/
http://utf8everywhere.org/

"Ladies and gentlemen, place your ears in the amenable-to-bended position, and
stand by to be swept along by the next great one-and-only true movement."

It's unfortunate that Windows still doesn't have good UTF-8 support.

Via H. Peter Anvin, who wrote:

UTF-16 (what Microsoft likes to incorrectly call "Unicode") is completely
braindead.  It takes all the disadvantages of multibyte encodings and all the
disadvantages of wide encodings and combines them, and just for good measure
throws in a couple of more (artificially constraints the Unicode encoding
space, doesn't sort in Unicode code point order.)

Unfortunately this article uses the confusing Microsoft "Unicode = UTF-16"
terminology.  Unicode itself is awesome.  For interchange, encode it as
UTF-8.  For processing, if random access matters, encode it as UCS-4 (i.e.
native byte order UTF-32).

Share and enjoy,
            *** Xanni ***

--
Andrew Pam
Partner, Glass Wings http://glasswings.com.au/

Comment via email

Home E-Mail Sponsors Index Search About Us