День 20240521.

21.05.2024

История 00070. Таинственный мир HTML сущностей.

Главная :: Поиск :: Карта :: Контакты



*** Описание - введение ***

Развлекательно - познавательная информация для тех, кто хочет начать погружение в веб дизайн и программирование.

Как вы думаете, сколько букв в алфавите русского языка? Если вы считаете, что 33, то я с удовольствием с вами поспорю.

Я считаю, что всего лишь 32, т.к. буква "ё" формально существует, но лучше ее никогда не использовать на практике. По современным правилам букву "ё" всегда можно заменить буквой "е", но нельзя поступать наоборот. Это означает, что использование буквы "ё" ничем не оправдано и несет в себе дополнительные риски ошибок. А раз мы букву "ё" никогда не используем, то зачем ее считать буквой алфавита?

Впрочем, все эти диспуты о русском языке покажутся детскими по своей простоте и наивности, если мы начнем рассуждать о китайском языке.

Как китайцы набирают свои тексты? Используют огромные клавиатуры с площадью несколько квадратных метров? Или кропотливо комбинируют сбор иероглифов хитрыми комбинациями клавиш на клавиатурах, которые похожи на наши? А может голосом диктуют свои рассказы, а умный софт компьютера переводит китайскую речь в китайский текст на иероглифах?

Все перечисленные выше варианты реальны и все они трудоемки, требуют ясности ума, чистоты мышления и большого трудолюбия.

Впрочем, это еще полбеды. А как хранится это огромное количество иероглифов и сколько их вообще?

Если мы можем согласиться, что в русском языке 32 буквы, ну, пускай, максимум 33, то в китайском языке все сложнее. Не всякий сможет подсчитать их точное количество. Кто-то говорит, что всего лишь 800, кто-то 3000. Другие специалисты утверждают, что около ста тысяч. Но это неточно.

Так сколько же иероглифов в китайском языке? У меня есть простой, четкий и однозначный ответ на этот, казалось бы, сложный вопрос. Ровно 20992 знака. Как мне удалось так точно подсчитать? Я открою вам этот секрет. Следите за полетом моей мысли.

Как всем известно, мы с вами работаем в кодировке "UTF-8", самым популярном представлении Юникода. При этом используем 1112064 кодовых позиций, т.е. символов. По сути, у нас тут получается мировой алфавит из более чем миллиона букв. В этот алфавит входят все английские и русские буквы, китайские иероглифы, буквы известных древних языков и разного рода "веселые картинки".

Русские буквы находятся в этом алфавите, начиная с позиции 1040 (большая русская буква А) до позиции 1103 (маленькая русская буква я).

Самые популярные китайские иероглифы занимают места от 19968 до 40959. Нехитрая арифметика дает тут результат по общему количеству: 20992.

Вообще, в нашем мировом алфавите есть много чего интересного и удивительного. Есть хитрые математические значки. Если буквы, знаки и иероглифы практически всех известных живых и мертвых языков мира. Если множество разных "картинок" для развлекательных и познавательных потребностей.

Предлагаю вам поверхностно познакомиться с этим алфавитом. Давайте, бросим взгляд на 80 произвольно выбранных знаков из этого алфавита.

...

Интересно что будет дальше?

...

Нажмите здесь для продолжения:
История 00070. Таинственный мир HTML сущностей. (на wpvi.ru)