что такое короткое целое
Свод правил по работе с целыми числами в C/C++
В основу статьи легли мои собственные выработанные нелегким путем знания о принципах работы и правильном использовании целых чисел в C/C++. Помимо самих правил, я решил привести список распространенных заблуждений и сделать небольшое сравнение системы целочисленных типов в нескольких передовых языках. Все изложение строилось вокруг баланса между краткостью и полноценностью, чтобы не усложнять восприятие и при этом отчетливо передать важные детали.
Всякий раз, когда я читаю или пишу код на C/C++, мне приходится вспоминать и применять эти правила в тех или иных ситуациях, например при выборе подходящего типа для локальной переменной/элемента массива/поля структуры, при преобразовании типов, а также в любых арифметических операциях или сравнениях. Обратите внимание, что типы чисел с плавающей запятой мы затрагивать не будем, так как это большей частью относится к анализу и обработке ошибок аппроксимации, вызванных округлением. В противоположность этому, математика целых чисел лежит в основе как программирования, так и компьютерной науки в целом, и в теории вычисления здесь всегда точны (не считая проблем реализации вроде переполнения).
Типы данных
Базовые целочисленные типы
Целочисленные типы устанавливаются с помощью допустимой последовательности ключевых слов, взятых из набора
Несмотря на то, что битовая ширина каждого базового целочисленного типа определяется реализацией (т.е. зависит от компилятора и платформы), стандартом закреплены следующие их свойства:
Наличие знака
Дополнительные правила
Типы из стандартных библиотек
Преобразования
Представим, что значение исходного целочисленного типа нужно преобразовать в значение целевого целочисленного типа. Такая ситуация может возникнуть при явном приведении, неявном приведении в процессе присваивания или при продвижении типов.
Как происходит преобразование?
Главный принцип в том, что, если целевой тип может содержать значение исходного типа, то это значение семантически сохраняется.
Арифметика
Продвижение/преобразование
Неопределенное поведение
Счетчик цикла
Выбор типа
Отсчет вниз
Для циклов, ведущих отсчет вниз, более естественным будет использовать счетчик со знаком, потому что тогда можно написать:
При этом для беззнакового счетчика код будет таким:
Заблуждения
Все пункты приведенного ниже списка являются мифами. Не опирайтесь на эти ложные убеждения, если хотите писать корректный и портируемый код.
4.5 – Целочисленные типы данных без знака, и почему их следует избегать
Целочисленные типы данных без знака
В предыдущем уроке (4.4 – Целочисленные типы данных со знаком) мы рассмотрели целочисленные типы со знаком, которые представляют собой набор типов, которые могут содержать положительные и отрицательные целые числа, включая 0.
C++ также поддерживает беззнаковые целочисленные типы. Беззнаковые целочисленные значения – это целые числа, которые могут содержать только неотрицательные значения.
Определение беззнаковых целочисленных значений
Диапазоны значений целочисленных типов без знака
Ниже показана таблица, показывающая диапазоны беззнаковых целочисленных типов:
Размер / Тип | Диапазон |
---|---|
1 байт без знака | от 0 до 255 |
2 байт без знака | от 0 до 65 535 |
4 байт без знака | от 0 до 4 294 967 295 |
8 байт без знака | от 0 до 18 446 744 073 709 551 615 |
Диапазон беззнаковой переменной размером n бит составляет от 0 до (2 n )-1.
Целочисленные типы без знака хорошо подходят для сетей и систем с небольшим объемом памяти, когда нет необходимости в отрицательных числах, поскольку беззнаковые целочисленные значения могут хранить бо́льшие положительные числа, не занимая дополнительной памяти.
Напоминание относительно значений со знаком и без знака
Начинающие программисты иногда путаются между значениями со знаком и без знака. Простой способ запомнить разницу: чтобы отличить отрицательные числа от положительных, мы используем знак минус. Если знак не указан, мы предполагаем, что число положительное. Следовательно, целочисленное значение со знаком (целочисленный тип со знаком) может различать положительные и отрицательные числа. Целочисленное значение без знака (целочисленный тип без знака) предполагает, что все значения положительны.
Переполнение целочисленных значений без знака
Что произойдет, если мы попытаемся сохранить число 280 (для представления которого требуется 9 бит) в 1-байтовом (8-битном) целочисленном значении без знака? Ответ – переполнение.
Примечание автора
Как ни странно, в стандарте C++ прямо говорится, что «вычисление с использованием беззнаковых операндов никогда не может переполниться». Это противоречит общему мнению программистов о том, что целочисленное переполнение охватывает случаи как со знаком, так и без знака. Учитывая, что большинство программистов рассмотрело бы этот случай как переполнение, мы будем называть его переполнением, несмотря на утверждения C++ об обратном.
Если значение без знака выходит за пределы допустимого диапазона, оно делится на число, превышающее на единицу наибольшее число, допустимое для заданного типа данных, и сохраняется только остаток.
Число 280 слишком велико, чтобы поместиться в наш 1-байтовый диапазон от 0 до 255. Значение, которое на 1 больше максимального числа для этого типа данных, равно 256. Следовательно, мы делим 280 на 256, получая остаток 24. Остаток 24 – это то, что в итоге сохранится.
Вот еще один способ размышления о том же. Любое число, превышающее наибольшее число, которое может быть представлено заданным типом данных, просто «оборачивается» (или совершает циклический переход). Число 255 находится в диапазоне 1-байтового целочисленного типа, поэтому 255 сохранится нормально. А число 256 находится за пределами диапазона, поэтому оно оборачивается до значения 0. 257 оборачивается до значения 1. 280 оборачивается до значения 24.
Давайте посмотрим на это, используя 2-байтовые целые числа:
Как вы думаете, каким будет результат работы этой программы?
Приведенный выше код в некоторых компиляторах вызывает предупреждение, поскольку компилятор обнаруживает, что целочисленный литерал выходит за пределы допустимого диапазона для данного типа. Если вы всё равно хотите скомпилировать этот код, временно отключите параметр «Treat warnings as errors» (обрабатывать предупреждения как ошибки).
В качестве отступления.
Многие заметные ошибки в истории видеоигр произошли из-за поведения циклического перехода целочисленных значений без знака. В аркадной игре Donkey Kong невозможно пройти уровень 22 из-за бага переполнения, из-за которого у пользователя недостаточно бонусного времени для завершения уровня.
Споры по поводу чисел без знака
Многие разработчики (и некоторые крупные компании, например, Google) считают, что разработчикам следует избегать целочисленных типов без знака.
Во многом это связано с двумя типами поведения, которые могут вызывать проблемы.
На машине автора эта, казалось бы, невинно выглядящая программа дает следующий результат:
Во-вторых, непредвиденное поведение может возникнуть при смешивании целочисленных значений со знаком и без знака. В приведенном выше примере, даже если один из операндов ( x или y ) будет со знаком, другой операнд (беззнаковый) приведет к тому, что операнд со знаком будет преобразован в целочисленное значение без знака, и будет получено такое же поведение!
Рассмотрим следующий фрагмент:
Если вам нужно защитить функцию от отрицательных входных данных, используйте вместо этого утверждение или исключение. Они оба будут рассмотрены позже.
Начинающие программисты часто используют целочисленные типы без знака для представления неотрицательных данных или для того, чтобы воспользоваться дополнительно расширенным диапазоном. Бьярн Страуструп, разработчик C++, сказал: «Использование unsigned int вместо int для получения еще одного бита для представления положительных целых чисел почти никогда не бывает хорошей идеей».
Предупреждение
Избегайте использования числовых типов без знака, за исключением особых случаев или, когда это необходимо.
Не избегайте отрицательных чисел с помощью беззнаковых типов. Если вам нужен больший диапазон, чем предлагает числовой тип со знаком, используйте один из целочисленных типов гарантированной ширины, показанных в следующем уроке (4.6 – Целочисленные типы фиксированной ширины и size_t ).
Если вы всё же используете беззнаковые числа, по возможности избегайте смешивания чисел со знаком и без знака.
Так где же стоит использовать беззнаковые числа?
В C++ всё же есть несколько случаев, когда можно (или необходимо) использовать беззнаковые числа.
Во-первых, числа без знака предпочтительнее при работе с битами (рассматривается в главе O (это заглавная буква «о», а не «0»).
Во-вторых, использование беззнаковых чисел всё еще неизбежно в некоторых случаях, в основном тех, которые связаны с индексацией массивов. Подробнее об этом мы поговорим в уроках по массивам и индексированию массивов.
Также обратите внимание, что, если вы разрабатываете для встраиваемой системы (например, Arduino) или какого-либо другой системы с ограничениями процессора/памяти, использование чисел без знака более распространено и приемлемо (а в некоторых случаях неизбежно) по соображениям производительности.
СОДЕРЖАНИЕ
Ценность и представление
Некоторые компьютерные языки определяют целочисленные размеры машинно-независимым способом; другие имеют разные определения в зависимости от размера слова процессора. Не все языковые реализации определяют переменные всех целочисленных размеров, а определенные размеры могут даже не различаться в конкретной реализации. Целое число на одном языке программирования может иметь другой размер на другом языке или на другом процессоре.
Общие интегральные типы данных
Разные ЦП поддерживают разные интегральные типы данных. Обычно оборудование поддерживает как подписанные, так и беззнаковые типы, но только небольшой фиксированный набор значений ширины.
В приведенной выше таблице перечислены значения ширины целого типа, которые аппаратно поддерживаются общими процессорами. Языки программирования высокого уровня предоставляют больше возможностей. Обычно используется целочисленный тип с двойной шириной, который имеет вдвое больше битов, чем самый крупный тип, поддерживаемый аппаратным обеспечением. Во многих языках также есть типы битовых полей (указанное количество битов, обычно ограничиваемое максимальной шириной, поддерживаемой оборудованием) и типы диапазонов (которые могут представлять только целые числа в указанном диапазоне).
Четырехбитная величина известна как полубайт (при еде, меньший, чем укус ) или полубайт (каламбур на форме байта слова ). Один полубайт соответствует одной цифре в шестнадцатеричной системе счисления и содержит одну цифру или знаковый код в десятичной двоичной системе счисления.
Байты и октеты
Термин « байт» изначально означал «наименьшую адресуемую единицу памяти». Раньше использовались 5-, 6-, 7-, 8- и 9-битные байты. Также были компьютеры, которые могли адресовать отдельные биты («машина с битовой адресацией») или которые могли адресовать только 16- или 32-битные величины («машина с адресацией по словам»). Термин « байт» обычно вообще не использовался в связи с машинами с битовой и словарной адресацией.
Слова
Практически все новые настольные процессоры способны использовать 64-битные слова, хотя встроенные процессоры с 8- и 16-битным размером слова все еще распространены. 36-битная длина слова была распространена в первые дни компьютеров.
Короткое целое число
Язык программирования | Имя типа данных | Подпись | Размер в байтах | Минимальное значение | Максимальное значение |
---|---|---|---|---|---|
C и C ++ | короткая | подписано | 2 | −32 767 | +32 767 |
беззнаковый короткий | беззнаковый | 2 | 0 | 65 535 | |
C # | короткая | подписано | 2 | −32 768 | +32 767 |
ushort | беззнаковый | 2 | 0 | 65 535 | |
Джава | короткая | подписано | 2 | −32 768 | +32 767 |
Длинное целое
Целое (тип данных)
Содержание
Представление
В памяти типовой компьютерной системы целое число представлено в виде цепочки битов фиксированного (кратного 8) размера. Эта последовательность нолей и единиц — ни что иное, как двоичная запись числа, поскольку обычно для представления чисел в современной компьютерной технике используется позиционный двоичный код. Диапазон целых чисел, как правило, определяется количеством байтов в памяти компьютера, отводимых под одну переменную.
Для 64-разрядных операционных систем учитывая разность моделей данных (LP64, LLP64, ILP64), представление целого типа на разных моделях данных может отличаться между собой. Тип int и long может составлять как 4 так и 8 байт.
Стоит отметить, что каждый язык программирования реализует свою сигнатуру представления целых чисел, которая может отличатся от международных стандартов, но обязана его/их поддерживать. К примеру можно отнести кросс-платформенную библиотеку Qt, где целое представляется типом qintX и quintX, где X-8,16,32,64.
Целые типы подразделяются на беззнаковые (англ. unsigned ) и знаковые (англ. signed ).
Беззнаковые целые
В C и C++ для обозначения беззнаковых типов используется префикс unsigned. В C# в качестве показателя беззнаковости используется префикс u (англ. unsigned). Например, для объявления беззнакового целого, равного по размеру одному машинному слову используется тип uint.
Беззнаковые целые, в частности, используются для адресации памяти, представления символов.
Иногда в литературе [1] встречаются рекомендации не использовать тип беззнаковые целые, поскольку он может быть не реализован процессором компьютера, однако вряд ли этот совет следует считать актуальным — большинство современных процессоров (в том числе x86-совместимые [2] ) одинаково хорошо работают как со знаковыми, так и с беззнаковыми целыми.
В некоторых языках, например java, беззнаковые целые типы (за исключением символьного) отсутствуют. [3]
Целые со знаком
Предельные значения для разных битностей
Ниже представлена таблица предельных значений десятичных чисел для разных битностей при кодировании дополнительным кодом. Не зависимо от битности у целых без знака минимальным значением всегда является 0 и поэтому оно не упомянуто. Справа от значения указано количество значащих цифр.
Бит | Максимальное без знака | Минимальное со знаком | Максимальное со знаком | |||
---|---|---|---|---|---|---|
Значение | Цифр | Значение | Цифр | Значение | Цифр | |
4 | 15 | 2 | -8 | 1 | 7 | 1 |
8 | 255 | 3 | -128 | 3 | 127 | 3 |
16 | 65 535 | 5 | -32 768 | 5 | 32 767 | 5 |
24 | 16 777 215 | 8 | -8 388 608 | 7 | 8 388 607 | 7 |
32 | 4 294 967 295 | 10 | -2 147 483 648 | 10 | 2 147 483 647 | 10 |
48 | 281 474 976 710 655 | 15 | -140 737 488 355 328 | 15 | 140 737 488 355 327 | 15 |
64 | 18 446 744 073 709 551 615 | 20 | -9 223 372 036 854 775 808 | 19 | 9 223 372 036 854 775 807 | 19 |
96 | 79 228 162 514 264 337 593 543 950 335 | 29 | -39 614 081 257 132 168 796 771 975 168 | 29 | 39 614 081 257 132 168 796 771 975 167 | 29 |
128 | 340 282 366 920 938 463 463 374 607 431 768 211 455 | 39 | -170 141 183 460 469 231 731 687 303 715 884 105 728 | 39 | 170 141 183 460 469 231 731 687 303 715 884 105 727 | 39 |
Операции над целыми
Арифметические операции
К целочисленным значениям применимы в первую очередь арифметические операции. Ниже приведены самые часто используемые (в скобках указаны их обозначения в различных языках программирования и им аналогичным средствах).
В некоторых языках программирования для лаконичности есть операторы, которые позволяют производить арифметическую операцию с присвоением. Например, «+=» складывает текущее значение переменной слева с выражением справа и помещает результат в исходную переменную. Так же в некоторых языках и средах доступна совмещённая операция MulDiv, которая умножает на одно число, а потом делит результат на второе.
Обычно самыми дорогими по скорости операциями являются умножение и деление (получение остатка от деления).
В памяти компьютера для хранения целых чисел обычно отводится ячейки фиксированного объёма. Из-за этого операции увеличения и уменьшения значений могут приводить к переполнению, что оборачивается искажением результата. Некоторые языки программирования позволяют производит вызов исключения в таких случаях. Кроме этого можно определять поведение при переполнении:
Побитовые операции
Помимо математических, к целым числам применимы битовые операции, которые основаны на особенностях позиционного двоичного кодирования. Обычно они выполняются значительно быстрее арифметических операций и поэтому их используют как более оптимальные аналоги.
Работа со строками
Довольно частыми операциями являются получение строки из числового значения во внутреннем представлении и обратно — число из строки. При преобразовании в строку обычно доступны средства задания форматирования в зависимости от языка пользователя.
Ниже перечислены некоторые из представлений чисел строкой.
Перечислимый тип
К целым относится также перечислимый тип. Переменные перечислимого типа принимают конечный заранее заданный набор значений. Размер набора не определяется числом байтов, используемых для представления целочисленных значений переменных такого типа.
короткое целое
Смотреть что такое «короткое целое» в других словарях:
короткое целое (слово) — Обычно 16 разрядов. — [Е.С.Алексеев, А.А.Мячев. Англо русский толковый словарь по системотехнике ЭВМ. Москва 1993] Тематики информационные технологии в целом EN short integer … Справочник технического переводчика
короткое целое число — — [Л.Г.Суменко. Англо русский словарь по информационным технологиям. М.: ГП ЦНИИС, 2003.] Тематики информационные технологии в целом EN short integer … Справочник технического переводчика
Целое (тип данных) — Целое, целочисленный тип данных (англ. Integer), в информатике один из простейших и самых распространённых типов данных в языках программирования. Служит для представления целых чисел. Множество чисел этого типа представляет собой… … Википедия
Семейство полорогие — (Bovidae)** * * Семейство полорогих, или бычьих самая обширная и разнообразная группа парнокопытных, включает 45 50 современных родов и около 130 видов. Полорогие животные составляют естественную, ясно очерченную группу. Как ни… … Жизнь животных
АРИФМЕТИКА — искусство вычислений, производимых с положительными действительными числами. Краткая история арифметики. С глубокой древности работа с числами подразделялась на две различные области: одна касалась непосредственно свойств чисел, другая была… … Энциклопедия Кольера
Тропические леса и их Фауна — Блистает лес красой богатой. Как некий новый, дивный мир. До сих пор мы бродили по пустыне и ознакомились со степью; бросим теперь взгляд на леса внутренней Африки, которые можно назвать девственными лесами. Многие из них не… … Жизнь животных
система — 4.48 система (system): Комбинация взаимодействующих элементов, организованных для достижения одной или нескольких поставленных целей. Примечание 1 Система может рассматриваться как продукт или предоставляемые им услуги. Примечание 2 На практике… … Словарь-справочник терминов нормативно-технической документации
ГОСТ Р 50030.5.1-2005: Аппаратура распределения и управления низковольтная. Часть 5. Аппараты и коммутационные элементы цепей управления. Глава 1. Электромеханические аппараты для цепей управления — Терминология ГОСТ Р 50030.5.1 2005: Аппаратура распределения и управления низковольтная. Часть 5. Аппараты и коммутационные элементы цепей управления. Глава 1. Электромеханические аппараты для цепей управления оригинал документа: (обязательное)… … Словарь-справочник терминов нормативно-технической документации
Ломоносов, Михаил Васильевич — — ученый и писатель, действительный член Российской Академии Наук, профессор химии С. Петербургского университета; родился в дер. Денисовке, Архангельской губ., 8 ноября 1711 г., скончался в С. Петербурге 4 апреля 1765 года. В настоящее… … Большая биографическая энциклопедия
Костюм эпохи Позднего Средневековья (Франция) — Костюм эпохи Позднего Средневековья выполнял во многом социальную функцию. Ношение платья в XIV XVI веках определялось понятием «луковицы», когда верхнее платье надевалось поверх нижнего, и количество слоёв зависело от социального статуса хозяина … Википедия
Семейство куньи — (Mustelidae)* * Семейство куньи включает 23 современных рода и около 65 видов хищных, от мелких (в том числе самых мелких представителей отряда) до средних (до 45 кг). Куньи распространены по всей Евразии, Африке, Северной и Южной Америке … Жизнь животных