Эта статья о том, что такое Интернет, и как он работает.
Необходимые знания:
Отсутствуют, но мы будем признательны, если вы сначала прочтёте Материал о там как начать разрабатывать свой сайт
Цель:
Вы изучите основы технической инфраструктуры Веба и поймёте разницу между Вебом и интернетом.
Резюме
Активное изучение
Погружаемся глубже
Простая сеть
Когда нужно связать между собой два компьютера, вы должны связать их в сеть либо проводным (обычно с помощью Ethernet кабеля), либо беспроводным способом (например, с помощью WiFi или Bluetooth). Современные компьютеры поддерживают любой из этих способов связи.
Примечание: До конца этой статьи мы будем говорить только о физическом (проводном) способе подключения, но беспроводные сети работают аналогичным образом.
Таким способом вы можете подключить более двух компьютеров, но с каждым новым это становится все сложнее. Если хочется подключить, скажем, 10 компьютеров, вам понадобится 45 кабелей и 9 сетевых плат в каждом компьютере!
Чтобы решить эту проблему, каждый компьютер в сети подключается к специальному маленькому компьютеру. Этот компьютер называют маршрутизатором. Маршрутизатор исполняет только одну роль: как сигнальщик на железной дороге он следит за тем, чтобы пакет, отправленный одним компьютером — источником — достиг пункта назначения. Чтобы отправить сообщение компьютеру B, компьютер A сначала должен отправить его маршрутизатору, который перенаправит его компьютеру B и проконтролирует, чтобы данные не попали компьютеру C.
С добавлением маршрутизатора наша сеть здорово упрощается: чтобы соединить 10 компьютеров нам требуется только 10 кабелей (каждый кабель соединяет маршрутизатор с одним из компьютеров).
Сеть сетей
Пока все нормально. Но что нам делать, если нужно объединить в сеть сотни, тысячи или миллиарды компьютеров? Конечно, один маршрутизатор не справится с этой задачей, но если вы внимательно читали, то помните, что маршрутизатор — это обычный компьютер, и ничто не мешает нам соединить друг с другом 2 маршрутизатора. Давайте сделаем это.
Подключая компьютеры к маршрутизатору, а затем — маршрутизатор к другому маршрутизатору, мы можем увеличивать нашу сеть до сколь угодно больших размеров.
Такая сеть уже очень похожа на то, что мы называем интернетом, но мы что-то упустили. Наша сеть построена для решения только наших задач. Но кроме неё есть и другие сети: наши друзья, соседи — кто угодно может создать свою сеть. Как же нам их объединить? Мы не можем протянуть кабели между нашим домом и всеми остальными сетями в мире. Чтобы решить эту проблему, мы можем воспользоваться уже существующими кабельными сетями. Ведь у нас дома уже есть кабели, например, электрические или телефонные. Телефонный провод уже соединяет ваш дом со всем остальным миром, так что он идеально подходит для решения нашей задачи. Чтобы подключить нашу сеть к глобальной сети с помощью телефонного провода, нам понадобится специальное оборудование, которое называется модем. Модем перекодирует информацию, поступающую из нашей сети в формат, который можно передавать через телефонную сеть, и наоборот, декодируют информацию из телефонной сети в формат, который распознают наши компьютеры.
Итак, мы подключились к телефонной сети. Следующий шаг — передать сообщение из нашей сети в сеть, с которой мы хотим связаться. Чтобы сделать это, мы должны подключить нашу сеть к провайдеру услуг интернета (Internet Service Provider (ISP)). Провайдер — компания, которая обслуживает специальные маршрутизаторы, которые не только подключены друг к другу (объединяют в единую сеть всех клиентов провайдера), но также связаны с маршрутизаторами других провайдеров. Таким образом, наше сообщение, пройдя транзитом через сеть нескольких провайдеров, достигнет сеть назначения. Интернет — это сеть сетей, которая объединяет в себе всю вышеперечисленную инфраструктуру.
Поиск компьютера
Чтобы послать сообщение какому-то компьютеру, необходимо как-то обратиться к нему, выделить среди других. Поэтому каждый компьютер, подключённый к сети, имеет свой уникальный адрес для связи: этот адрес называют IP-адресом (IP — сокращение для Internet Protocol, протокол интернета). В зависимости от версии протокола IP этот адрес может записываться по-разному. Самая широко используемая версия интернет-протокола — версия 4. Адреса IPv4 обычно записываются в виде четырёх чисел, разделённых точками, например: 192.168.2.10.
Такие адреса отлично подходят для компьютеров, но людям очень сложно их запоминать. Чтобы упростить себе жизнь, мы можем присвоить каждому IP-адресу псевдоним с понятным для человека именем. Такой псевдоним называют доменным именем. Например, google.com — доменное имя, которое является псевдонимом IP-адреса 173.194.121.32. Использование доменного имени — самый простой способ обратиться к компьютеру в интернете.
Обычный пользователь определяет понятие интернета как площадку обмена информацией. Это лишь общее его назначение. Чтобы понять что такое интернет — нужно узнать как он устроен.
Сейчас я постараюсь это понятно объяснить в статье.
Кратко из истории интернета
Всё началось с того, что министерство обороны США готовилось к войне с СССР (1957 год) и им было необходимо придумать надёжный источник передачи данных. Было предложено создать сеть где каждый компьютер имел равные права. Благодаря этому уничтожив 1 компьютер — данные сохранялись на других и система не ломалась. Это решало проблему сохранения данных.
Такая сеть соединила 4 крупных учебных заведения, которые продолжали её развивать. Только в 1969 году удалось передать первую информацию в ней.
Это было слово LOG (сокращение login) и в этом году можно сказать зародился интернет.
Затем в 1973 эта сеть стала уже международной. Её стали использовать несколько стран. Сейчас же 2/3 населения земли пользуются интернетом и этот показатель постоянно растёт. Сложно представить современную жизнь без него.
Компьютерные сети
Интернет представляет собой связь компьютеров во всём мире — сеть. В ней участвуют наибольшее число компьютеров, которые так же связанны между друг другом. Существует 2 типа сетей.
Первая — локальная или LAN:
В ней организовывается связь между каким-либо количеством компьютеров. Она обычно организовывается дома или в офисе.
Вторая — глобальная или Wide Area Network:
Как видите в состав глобальной входят несколько локальных. Всеми ими управляет сервер (об этом дальше). Интернет — это как раз самая большая такая сеть (но это ещё не всё).
Чтобы лучше это понять посмотрите видео.
Клиент и сервер
Находясь в интернете вы используете технологию передачи данных — клиент и сервер.
Сервер — это обслуживающий компьютер, обслуживает он другие компьютеры и он обычно намного мощнее их так, как на него возлагается сильная нагрузка.
Этот сайт тоже находится на сервере, когда вы сюда зашли, вы как клиент отправили запрос на отображения страницы, сервер принял запрос и начал искать данные в своей базе. Когда он их нашёл — он отправил их вам. Ваш компьютер в данном случае является клиентом. При этом он скачивает их себе.
Посмотрите на изображение ниже чтобы лучше понять это:
Таким образом осуществляется процесс передачи данных.
Вся информация передаётся по определенному протоколу. Его называют TCP/IP. Благодаря протоколу можно получать данные с разных устройств (ноутбук, телефон, спутник и другие).
Протокол — это определенные правила при обмене информации.
Как у человека есть правила введения общения между друг другом, так же и у компьютеров они есть. Вообще обмен информации по протоколу очень похож на обмен информации между людьми в общении.
Если вы немного не поняли, то посмотрите это видео.
Физическая и виртуальная составляющая
Люди часто путают физическую и виртуальную составляющую интернета.
Интернет — представляет собой физическую сеть, соединяющую все компьютеры на земле.
То есть это множество проводов, которые используются для соединения. Её часто путают с WWW (всемирной паутиной).
Всемирная паутина — это множество сайтов, которые связанны гиперссылками (в отличии от обычной ссылки, они ведут на ресурсы в интернете).
Всемирная паутина — это виртуальная сеть и она представляет собой отдельную частью интернета. Когда говорят об интернете — обычно имеют в виду именно её, но это лишь его сервис.
Так же об этом можно посмотреть видео.
Веб сайты
Веб сайты — место во всемирной паутине (WWW).
Они состоят из веб страниц. Веб страница — тоже самое, что и веб сайт только это место уже на сайте. Такие страницы состоят из документов на языке HTML. Вот так выглядит кусок кода HTML этой страницы:
HTML — язык разметки. С помощью него размечают положения изображений, текста, видео и остальных элементов веб страницы. Для изменения внешнего вида HTML документов используется язык стилей CSS.
Весь обмен данными обычно осуществляется через сайты. Они — наиболее удобная площадка для этого.
Для того, чтобы зайти на сайт нужно ввести его адрес в строке вашего поиска:
Этот адрес называется URL. Таким образом вы оправляете запрос на сервер через ваш поисковик, сервер отдаёт вам данные и вы их видите на странице в поисковике.
Сам URL сделан для удобства восприятия пользователями. На самом деле при вводе URL вы посылаете запрос серверу в виде IP-адреса.
IP-адрес — это адрес расположения компьютера в сети, в данном случае глобальной (есть ещё и локальные).
Итоговое определение
Из полученных знаний представленных выше можно составить такое определение:
Интернет — это физическая, глобальная сеть, связывающая самое большое количество в мире компьютеров проводами и предоставляющая доступ к всемирной паутине (WWW) в целях передачи в ней информации.
Надеюсь вы поняли, что такое интернет. Свои дополнения оставляйте в комментариях.
Как работает глобальная сеть интернет: Принцип и схема
Приветствую Вас, друзья! Большинство привыкло пользоваться «инетом» и не задаваться вопросом, как всё устроено. Есть те, кто хочет всё-таки понять принцип, схему глобальной сети и узнать: Как работает интернет. В статье кратко постараюсь изложить простыми словами основные моменты для пользователя, а не для тех, кому надо разбираться в этом профессионально со всеми техническими терминами и определениями.
Что такое интернет простыми словами
Интернет — это глобальная международная система связи компьютеров. По мере развития технологий, компьютерами стали: смартфоны, планшеты и даже бытовая техника, которая имеет доступ к всемирной паутине.
Основное достижение интернет-технологий, это скорость с которой любой компьютер внутри сети может связаться с другим за считанные секунды и получить или отправить нужную информацию.
Как устроена и работает сеть интернет
Для того, чтобы из любой точки Земли можно было получить доступ к интернету, вся планета окутана кабелями. Для связи между континентами кабели уложены по дну морей и океанов.
Скорость передачи обеспечивает применение в кабеле «оптического волокна» или как его называют в народе «оптоволокна». Оптоволокно обеспечивает диэлектрическую направляющую среду для проведения волн инфракрасного и оптического диапазонов.
Для построения всей схемы применяется сеть хранения и маршрутизации трафика:
Для простого пользователя важно одно, чтобы при обращении к сети быстро получать требуемую информацию. Неважно, что это будет: запрос, оплата услуг, использование сервиса или игра.
Весь принцип можно описать так: Клиент — любое устройство, которое подключено к интернету и отправляет свой запрос к сети. В этот момент происходит обработка полученного запроса по всей необходимой цепочке для его выполнения и получения результата клиентом.
Принцип и схема работы интернета кратко
Для передачи данных используется пакетная технология и используется протокол TCP/IP.
После того, как пользователь (клиент) обращается к сети со своим запросом запускается процесс, который хорошо виден из этой схемы.
Виды технологий интернета для передачи данных
Кабельный
Самый доступный по цене и наилучший по скорости для использования в помещениях. При установке WI-FI роутера даёт возможность пользоваться беспроводным подключением любому гаджету в радиусе действия сигнала.
Сейчас технология беспроводной сети встроена в каждый гаджет и стала самой популярной системой у пользователей. Передача сигнала происходит на радиоволнах в диапазоне 2,4 ГГц и 5 ГГц.
Wi-Fi модемы от операторов мобильной связи используются в местах непостоянного пребывания пользователями ноутбуков, компьютеров, где нет стационарного подключения.
Спутниковый
Применяется там, где нет возможности подключиться к кабельной сети. Используется спутниковая тарелка и модем. В данный момент скорость передачи выросла, но имеет дорогие тарифы и недешёвое оборудование.
Мобильный
В телефон, смартфон, планшет встроен GPRS модем, благодаря которому аппарат имеет прямой выход в интернет через подключенного провайдера мобильной связи.
Как устроена всемирная паутина? Почему за пару секунд вы можете найти ответ практически на любой вопрос? Мы простыми словами объясним, что происходит после клика на ссылку и как работает Интернет.
Что такое Интернет
Интернет появился в конце 1960-х годов, развившись из сети Arpanet Министерства обороны США. Цель Arpanet состояла в том, чтобы одновременно использовать возможности нескольких больших компьютеров и связать в одну сеть университеты и исследовательские институты.
Если говорить простыми словами, то Интернет представляет собой совокупность большого количества компьютерных сетей, которые обмениваются друг с другом данными. Это позволяет нам использовать службы вроде электронной почты или посещать сайты.
Как работает Интернет
Для обмена данными решающее значение имеют Интернет-узлы, которые можно смело назвать важными компонентами Всемирной сети. Они распределены по всему миру и пересылают данные друг другу. Как правило, десятки, а иногда и сотни поставщиков услуг (провайдеры) подключаются к одному Интернет-узлу. Внутри сетевого узла обмен данными происходит уже среди провайдеров. Провайдеры, в свою очередь, обеспечивают клиентам доступ к Интернету, предоставляя соответствующие соединения, такие как DSL или LTE.
Крупнейший в мире узел, если смотреть по объемам проходящего через него трафика, расположен в Германии, во Франкфурте-на-Майне, где он распределен по 19 центрам обработки данных.
Многие компании используют собственные сети, называемые интрасетями, которые становятся частью Интернета с установлением подключения к провайдеру. В то время как частные лица в основном являются только пользователями и получателями информации или услуг, многие компании сами предлагают Интернет-услуги. Помимо предоставления общей информации, они могут включать в себя интернет-торговлю, облачные хранилища или сервисы онлайн-резервирования товаров или услуг.
Фактическая связь между интернет-узлами и провайдерами осуществляется по всему миру с помощью волоконно-оптических кабелей, благодаря которым возможна высокая скорость передачи данных. Соединение частных домов или компаний с сетью Интернет, также иногда называемое «последней милей» — «last mile», обычно реализуется через медный кабель, радиосвязь или стекловолокно.
Чтобы все работало гладко, обмен данными регулируется так называемыми протоколами. Например, с помощью Интернет-протокола устанавливается, что передаваемые данные разбиваются на небольшие пакеты у отправителя, а затем передаются и повторно собираются у получателя.
Чтобы пакет данных знал, откуда он отправлен и куда он должен прийти, каждый компьютер, участвующий в коммуникации, получает уникальный адрес — IP, — который состоит из четырех блоков чисел, разделенных точками. Поскольку вряд ли кто-либо может запомнить IP-адреса посещаемых веб-сайтов или других сервисов, существует система доменных имен — Domain Name System (DNS). Домены можно использовать в Интернете вместо IP-адресов в качестве более понятных, «говорящих» названий сайтов или Интернет-серверов. Пользователю они знакомы как www-адреса или URL.
Что происходит, когда я захожу на сайт?
Вызов веб-сайта — это только один из бесчисленных процессов в Интернете. Рассмотрим на простом примере, как это работает.
1. Если вы вводите URL-адрес в браузере, например www.ichip.ru, запрос отправляется вашему провайдеру после нажатия клавиши Enter. Провайдер переводит имя в IP-адрес целевого сервера, на котором хранится искомая веб-страница.
2. Для «перекодирования» имен провайдер использует один или несколько специальных серверов. Они называются DNS-серверами, и у них есть только одна задача. DNS-серверы выступают как словарь и хранят каталог всех Интернет-сайтов и связанных с ними IP-адресов.
3. Когда IP-адрес конечного сервера определен, запрос пересылается через Интернет-узлы на веб-сервер, на котором находится искомая страница. Поскольку Интернет охватывает весь мир, существуют и другие способы передачи пакетов данных. Чтобы найти оптимальный способ, все сети связаны маршрутизаторами, которые принимают пакеты данных, а затем решают, куда их пересылать.
4. Когда запрос достигает своего адресата, сервер отвечает и возвращает содержимое веб-сайта. Теперь они должны найти путь к вашему компьютеру, с которого вы отправили запрос.
5. Чтобы эта цепочка работала, пакеты данных содержат не только информацию о получателе, но и IP-адрес отправителя. Процедура такая же: через маршрутизатор пакеты ответов переходят от сети к сети и, наконец, попадают на ваш компьютер. Там они собираются вместе, и поисковый веб-сайт отображается в браузере.
Теперь вы знаете, как работает Интернет. А что насчет его истории? Пройдите наш тест: как хорошо вы знаете историю Интернета.
Abstract: Рассказ про устройство Интернета, как «сети сетей» в виде текста для чтения, без двоичной системы счисления и нюансов BGP. Большая часть расказа будет не про процесс общения ноутбука с точкой доступа, а о том, что происходит после того, как данные пройдут «шлюз по умолчанию». Предупреждаю, букв много.
Вступление
Маленький провокативный вброс: ни один из читателей этой статьи к Интернету не подключен. Все подключены к сети своего провайдера, и не более. Подключение к Интернету дорогое, его сложно делать, вам потребуется очень крутое оборудование, несколько договоров с несколькими операторами связи и квалифицированные сотрудники. Простому домашнему пользователю это никак и никогда не светит. Не говоря уже о том, что в Интернете может быть не больше 4 миллиардов подключившихся (а до недавнего времени было даже «не более 65536») [1]. Даже если весь Интернет перейдёт на ipv6, это число не поменяется.
Вот число подключившихся к Интернету [2]: По оси Y — число в штуках. Штуках, штуках. И вас в этом числе не посчитали.
Дело в том, что Internet — это, если переводить буквально, «межсетье». Сеть Сетей. И участниками Интернета являются не пользователи (их компьютеры, планшеты, микроволновки с wifi и т.д.), а сети. Сети и только сети участвуют в работе Интернета. Интернет — это то, что связывает разные сети между друг другом.
А вот отдельные узлы этих сетей — они уже могут посредством своей сети, подключенной к Интернету, связываться с другими узлами других сетей.
Впрочем, обо всём по порядку.
Что есть сеть?
Я пропущу всю драматичную и покрытую пылью историю первых десятилетий компьютеров. В какой-то момент возникло желание передавать информацию с компьютера на компьютер иначе, чем дырявя тысячи перфокарт. После долгих мучений и миллиардных инвестиций в сдохшие-таки протоколы, которые так и не стали стандартами (а некоторые стали, но всё равно сдохли), возникло понятие «локальной сети» (или «локалки»). Локальная сеть позволяет компьютерам, которые расположены рядом связываться друг с другом по адресу в этой сети. Понятие «рядом» очень растяжимое, и может растягиваться на несколько зданий, а если сильно напрячься, то и на пару городов.
Мы все привыкли к тому, что это самое, компьютерное, называется «сеть». Но мы ещё помним, что сетью называется то, чем ловят рыбу и прочие ячеистые структуры.
Так что если компьютерная, но сеть, то она тоже должна быть из ячеек. В то же самое время наш бытовой опыт говорит о том, что это никак не сеть, а настоящее компьютерное дерево. Листья (компьютеры, смартфоны, планшеты и т.д.) подключаются к веткам (маршрутизаторы, коммутаторы, точки доступа), которые снова подключаются к маршрутизаторам/коммутаторам, и так до тех пор, пока не образуется Главный Маршрутизатор, от которого линк обычно уходит к провайдеру Интернета. Или, в случае совсем локальной сети — никуда не уходит, ибо Маршрутизатор — он Главный.
Ответ: в такой конфигурации нет сети. Это не сеть. То есть это всё ещё компьютерная сеть, но очень частный, «порванный» её вариант. Настоящая компьютерная сеть подразумевает, что у нас в сети более чем один маршрутизатор, и они связаны друг с другом несколькими линками.
Ниже схема средней по размеру локальной сети. Круглые объекты — маршрутизаторы, квадратные — коммутаторы, за вычетом исходной точки и целевой точки все коммутаторы удалены для упрощения. Зелёным показан предпочительный путь, красным — дорогой отрезок.
Уже больше похоже на сеть?
Именно в избыточных связях и состоит главная идея Интернета. Создавали его американские военные (ARPANET) с простой целью — если любой из промежуточных узлов на этой схеме произойдёт повреждение (на войне бывает, знаете ли, копали окоп, порвали кабели), то связь должна сохраниться.
На самом деле я немного лукавлю — множество локальных сетей (было) построено не на протоколе IP, а на других протоколах (ATM, IPX/SPX).
Но мы говорим про победителя — про протокол IP (который так и расшифровывается — Internet Protocol).Сети, построенные на базе IP-протокола, и Интернет в частности работают на принципе hop-by-hop.
Hop by hop
Для того, чтобы исключить существование «центрального маршрутизатора всея Интернет» каждый маршрутизатор, решающий куда дальше послать принятый пакет, принимает это решение самостоятельно. И только в пределах своих соседей (directly connected). Этот принцип называется «шаг за шагом» (hop by hop). Альтернативой подобному подходу мог бы быть либо центральный координирующий узел, говорящий как передавать пакеты, либо указание маршрута в самом пакете.
Идея центрального координирующего узла натыкается на одну простую проблему — как донести информацию о новом маршруте до маршрутизатора, если использующийся для связи с маршрутизатором маршрут повреждён? Упс…
Идея «заранее проложенного маршрута» использовалась в UUCP (предшественник обычной электронной почты), но в условиях войны (одновременно: землетрясение, цунами, и авария на атомной электростанции) надеяться, что отправитель в курсе, какие узлы работают, какие нет, мягко говоря, наивно.
Таким образом, принцип hop-by-hop перекладывает всю ответственность за маршрут на данном участке на маршрутизатор, отвечающий за данный участок (в такой формулировке звучит как банальность).
Маршрутизатор обычно может довольно хорошо сказать, кто из его соседей живой, а кто нет. Плюс, он может общаться с соседями соседей и узнавать информацию о том, какие у них линки живые, а какие нет.
Второе (общение с соседями) называется «протокол маршрутизации». Он описывает то, каким образом маршрутизатор должен общаться с соседями и как именно это общение должно влиять на таблицу маршрутизации. Сами протоколы бывают двух типов — для работы «внутри сети», и для работы между сетями.
Таблица маршрутизации — это святая святых любого маршрутизатора. Её структура простая: весь трафик сети такой-то пересылается на адрес такой-то через сетевой интерфейс такой-то, плюс предпочтительность каждого маршрута. Чем точнее маршрут, тем он предпочтительней, а при прочих равных используется приоритет данного маршрута. Финальный (самый плохой) маршрут называется «на деревню дедушке», то есть «весь трафик». Это так называемый «шлюз по умолчанию». Его используют только если нет более точных маршрутов, и, что самое интересное, у обычных компьютеров (телефонов, планшетов, пылесосов, видеокамер, зубочисток с wifi и т.д.) очень часто бывает только он — маршрут по умолчанию, то есть ничего хорошего в их жизни нет.
Но это была присказка. Сказка будет впереди.
А что там, за аплинком?
Аплинком (uplink) называют того, от кого получают доступ к Интернету.
Как мы уже обсудили, настоящий Интернет объединяет сети. Такие сети называются «автономные системы», и называются они так потому, что ни от кого не зависят — они сами по себе. Автономные системы соединяются друг с другом (и сейчас мы обсудим как), передают свой трафик соседям, и даже передают трафик от одного соседа другому транзитом.
Важно понимать, что это личное право автономной системы принимать трафик от соседа и отправлять его соседу. Хотят — отправляют. Хотят — не отправляют, или отправляют не ближайшему соседу, а совсем другому, который пропускает трафик третьему, третий пятому, пятый в Автралию, а потом обратно. Кто кому какой трафик передаёт определяется межоператорскими соглашениями (или договорами попроще, если у вас маленькая, но горденькая автономненькая системка на два аплинка).
Итак, настоящий Интернет состоит из автономных систем и связей между ними.
Кто-то вообразил, что связь между автономной системой в Китае и, например, в Москве — это тысячи километров. Нет-нет. Размер (физический) линка между автономными системами обычно очень маленький — иногда это десятки сантиметров, иногда метры, в крайнем случае десятки метров.
Почему? Потому что если бы линк между ними был 10 000 километров, да ещё и висел бы на столбах, кто бы за этими столбами ухаживал, поливал их, подпирал и привязывал к проводам? Так что чаще всего все эти тысячи и тысячи километров оптики (медь умерла на таких дистанциях), которые и есть автономная система. Заметим, это целый отдельный мир, называемый «магистральные операторы». Их бизнес как раз в том и состоит, что они берут трафик с одной точки и доносят до другой через тысячи километров сквозь стужу, тракторы и медведей.
А вот соединения между автономными системами (их называют «стыки») обычно находятся в уютных холодных, сухих и тщательно охраняемых помещениях. Это могут быть серверные (например, у Селектела в серверной есть некотрое количество так называемых «операторских стоек» — как раз для того, чтобы операторы, которые там разместились, могли стыковаться друг с другом в комфортных условиях), или, если говорить про действительно крупные специализированные узлы, то используются отдельные помещения (чаще всего образующиеся стихийно из-за большой концетрации готовых трасс) — Internet Exchange (IX). Так что MSK-IX — это не «Москва-9», это «Мoscow Internet Exchange»). Туда приходят операторы (со своими проводами или арендованными) и коммутаторами (целыми, или маленьким кусочком посредством аренды VLAN/порта). А дальше трудолюбивые паучки начинают вязать всемирную паутину инженеры начинают заниматься тысячами кроссировок (соединением проводом одного коммутатора с другим). На этих кроссировках весь интернет и держится.
Главным протоколом Интернета (не по трафику, а по важности) является BGP (border gateway protocol). Этот протокол используется для общения между маршрутизаторами провайдеров/операторов на стыках автономных систем, то есть за пределами их сетей.
Каждая автономая система, участвующая в работе Интернета, анонсирует какие маршруты она принимает и через какого аплинка. А ведь автономных систем много. Тысячи их! Полный список всех анонсов называется Full View, и он описывает существование всего Интернета на планете Земля (насколько я знаю, автономных систем за пределами планеты нет, есть только отдельные узлы, которые маршрутизируют трафик через наземные машрутизаторы). Full View довольно большой (под 400 000 записей для ipv4, от 200Мб до 2Гб в размере в зависимости от железа и софта).
Заметим, что маршрутизатору с Full View не нужно иметь шлюза по умолчанию — перед ним карта всего Интернета.
Так как оператор сам решает какие префиксы (фрагменты сети того или иного размера) анонсировать и через кого, то он может указывать через кого принимать трафик. Например, выбирая между «хорошо и дорого» и «дешево» оператор может предпочесть дешево. А «дорого» оставить как резерв.
При этом очень важно, что «откуда оператор принимает трафик» не равно «куда он его отсылает». Это так называемые нессимметричные маршруты. Их появление — результат экономической политики и жадности.
Вот пример скромного несимметричного маршрута (фрагмент карты взят с сайта [3], маршрут своего собственного изобретения). Допустим, мы, сидя в Киеве решили попросить фотографию котика с сервера в Вильнюсе. Маршрутизатор нашего провайдера знает, что ближайший линк до Вильнюса — через Варшаву (зелёная стрелка). Сервер в Вильнюсе пошуршал, нашёл котика и отправляет его нам. Но оператор сети в Вильнюсе знает, что за трафик в кабеле до Варшавы с него срубят много-много денег. А в Москву он не отправляет трафик по политическим причинам. И вот, он отправляет его через другого оператора. В Риге. Который опять его отправлят в Стокгольм, тот отправляет дальше, трафик снова пересылают… И так пока картинка не доползёт до скучающего котофила в Киеве.
Заметим, анонсируя свои сети, оператор может творить чудеса (или ужасы). Оператор может анонсировать свои сети через нескольких аплинков — и в этом случае трафик к нему пойдёт через всех, причём выбор аплинка в том или ином случае пойдёт через наиболее удобный путь (который или ближе, или дешевле, тут уж как настроят). Это, кстати, лежит в основе большинства CDN (content distribution network) — оператор хранит копию раздаваемого содержимого на куче серверов по всему миру, имеет кучу стыков с местными операторами и всюду анонсирует свои (одни и те же) адреса. Получается, что в каждом регионе пользователю запросы принимают на ближайшем к нему (по маршруту) сервере, и оттуда же ему и отвечают, что получается сильно быстрее, чем через всю планету переспрашивать.
Так же оператор, может, например, не анонсировать часть адресов. В этом случает трафик умирает на первом же маршрутизаторе, который осознал, что дальше пути нет.
Вот пример вывода, который мне удалось получить во время недавних кратковременных работ на сетевом оборудовании. По мере того, как информация о завершении BGP-сессий между маршрутизатором и его аплинками расходилась по Интернету, трафик отправляли всё дальше и дальше, на маршрутизаторы, которые пока что считали, что они знают, куда отправлять трафик. В результате, после 255 хопов (т.е. передач между 255 маршрутизаторами) пакет умирал от старости, так и не достигнув назначения.
Аплинки аплинков: Tier 1
Простыми логическими рассуждениями легко понять, что если у аплинка есть аплинк, то либо аплинков бесконечное количество, либо они замкнуты в кольцо, либо есть такие аплинки, у которых нет аплинков.
И такие есть. Их называют Tier 1. Их отличие от всех остальных не в том, что они не имеют аплинков (всё-таки у нас сеть, верха/низа в формальном смысле нет), а в том, что они не платят никому за Интернет. Представьте себе компанию, которая получает сотни гигабит/с (терабиты?) трафика, столько же отправляет — и всё это на халяву. Чтобы получить на халяву интернет надо подойти к ближайшему макдональдсу/старбаксу поближе, найти их wifi… К сожалению, Tier 1 это вас не сделает. Чтобы быть Tier 1 нужно ещё одно условие — чтобы вам за интернет платили. Таким образом, они никому не платят, а им за связность платят.
Происходит это из-за очень хорошей связности (количества стыков) этих операторов. Очевидно, что местечко это очень уютненькое и соблазнительное, так что многие туда метят. Подробнее про то, как «дружат» между друг другом Tier 1 хорошо написано на nag.ru [4].
Пиры, пиринг и пиррова победа
Как мы выяснили, Tier 1 со всех деньги получают и никому не дают. Если есть два оператора, между которыми большой трафик (допустим, это очередной убийца ютуба с миллионами роликов про котят и новый мегателеком с миллионами жаждущих посмотреть на котят), то идеальная (с точки зрения Tier 1 оператора) картинка выглядит так: оба оператора подключаются к Tier 1 и платят за трафик. Убийца ютуба за исходящий, получатель котят — за входящий. Tier 1 доволен, убийца ютуба не может найти адекватную модель монетизации котят, а мега-телеком просит дотацию из бюджета.
Решение? Дотащить/арендовать кабель до уютной коммутационной и настроить локальный обмен. От ютубоубийцы к мегателекому. Итог: гигабайты котят ходят напрямую, расходы сокращаются. Tier 1 не очень доволен, но его бизнес вообще не котят гонять, а «самую крутую связность» делать, так что без своего куска хлеба он не останется.
Такое соединение называется пирингом (от peer). Его главное условие — участники пиринга друг другу не платят, или платят, но смешную сумму за аренду порта/кусочка физического линка.
Одно время любимым направлением пиринга были «контенто-генераторы» и «провайдеры Интернет». Но тут началось… Напстер, шареаза, едонкей, DC, и, под трубный глас копирайтных фанфар… торренты. Внезапно, объём трафика «между пользователями» стал в разы больше, чем между поставщиками контента и потребителями. И если ютуб и его клоны вполне могут потягаться, то какой-нибудь сайт с «много букв, мало картинок» (например, Хабрахабр) очевидно не может угнаться за пользователями, которые решили скачать всю Футураму и Симпсонов одним паком, да ещё и раздать обратно с рейтом 2.
Так что особую популярность приобрели стыки между провайдерами. В силу того, что многие провайдеры делают nat и серые адреса внутри сети, доходило до пиринга серыми адресами, причём провайдеры резали полосу по тарифу только в Интернет, а «пиринг локалками» шёл на скорости среды.
В результате у операторов в руках оказался гигантский трафик терабайтных масштабов.
Таким образом, пиринг должен быть выгоден обоим операторам. Оба оплачивают только порт для стыка и сколько-то за обслуживание этого стыка. И оба экономят… Когда бизнес экономит — это хорошо. Когда конкурент бизнеса экономит — это плохо. Так что в дело вступает большая корпоративная политика.
Если у нас есть провайдер А с трафиком в 10 Гб/с и провайдер Б с трафиком в 1Гб/с, а примерный объём пиринга между ними 500Мб/с, то…
… Надо ещё сказать, чаще всего магистралы деньги берут за полосу, по 95% персентилю, и по тому, какого было больше — исходящего или входящего.
Так вот, если будет пиринг между А и Б, то А экономит на пиринге 5% трафика, а Б — 50%. Очевидно, если А и Б конкуренты, то отказавшись от пиринга А почти ничего не потеряет, а вот Б будет сильно много платить аплинку, чтобы тот донёс трафик до А.
Ещё хуже, когда операторов три: А, Б, В. А и В большие, между ними стык в 10Гб/с, почти забитый. Б — маленький, и у него всего 500Мб/с. А и В пирятся, а Б не пускают. Б идёт к аплинку и платит кровные. За трафик до А и до В. А так как большинство пользователей у А и В, то у Б большая часть пользователей хочет получить/отправить трафик А или В. Для альянса А и В всё отлично — большая часть трафика локальная, а к конкурентам уходят сущие крохи. А для Б это означает, что большая часть трафика — платная и дорогая.
Таким образом, два больших дружат, а у Б всё плохо (дорого). А бывает так, что объединяются несколько больших операторов и решают устроить «бизнес». Получается ОПГ. Как любая ОПГ, она начинает «доить» тех, кого крышует и давить тех, кто сопротивляется. Ну, вы понимаете, кушать всем хочется.
… Ах да, ОПГ расшифровывается весьма невинно — Объединённая Пиринговая Группа. Чуть подробнее про это есть в блоге Кипчатова [5].
Войны вокруг пиринга существуют и будут существовать, увы. Mesh network хорош пользователям, но не тем, кто на Интернете зарабатывает.
Чёрные дыры в Интернете
В силу своей примитивности, DoS атаки (обычно любят добавлять DDoS, но distributed — это отдельный разговор) очень легко реализуемы. Десяток строчек на Си, одна строчка в шелле — и вот, очередной компьютер изо всех сил тужится, стараясь загадить Весь Интернет бессмысленным трафиком. Если таких компьютеров собрать несколько — можно получить поток хлама в гигабайты, десятки гигабайт, сотни гигабайт.
Если весь этот мусор направляется на один адрес, то получается беда. Входящий канал забивается в «потолок» и добросовестные пользователи просто не могут прислать свои запросы.
Проблема состоит в том, что могут забить не только канал конкретного сервера, но и входящий канал оператора (да, такое бывает). С учётом, как оплачиваются каналы между операторами (95% персентиль), большой поток мусорного трафика длительное время — это очевидные непродуктивные затраты.
Простейшее бытовое решение — прописать источник в drop на ближайшем маршрутизаторе, а то и коммутаторе. Но при этом оказывается, что во-первых, входящий канал всё равно перегружен, во-вторых его надо оплачивать, а в третьих мы сталкиваемся с проблемой «кого банить». Если весь трафик идёт с одного-двух адресов, задача простая. Но сделать флуд с поддельным адресом отправителя — легче лёгкого. Так что в совсем аварийных ситуациях блокируют адрес получателя (да-да, «добровольно умирают» для того, чтобы сохранить соседей), и переносят эту задачу на blackhole в BGP. В нормальной конфигурации в него должны добавляться свои адреса, а не чужие, но если аплинк по договорённости или по невнимательности разрешит анонсировать и чужие адреса, то это тоже можно сделать.
Рассказ про техническую часть blackhole BGP есть на хабре [6].
Как это выглядит? Для black hole выделен специальное комьюнити (условно говоря, ещё один, специальный, маленький full view), куда провайдер может анонсировать свои адреса с префиксом /32 (для ipv4). Выдали ему романтичный номер 666. Граничные маршрутизаторы обмениваются этой информацией по BGP, так что чёрная дыра расползется, медленно поглощая весь трафик, адресованный забаненному адресу на всех маршрутизаторах, которые эти анонсы видят (и поддерживают). В результате трафик на «жертву» начинает роняться на аплинках, аплинках аплинков — и так до ближайшего к источникам атаки «понимающих» маршрутизаторов. Они плохой трафик и дропнут, так что Интернет атаки не заметит. Адрес, впрочем, из интернета доступен не будет, так как «хороший» или «плохой» трафик машрутизатор разобрать не может.
Ссылки
Большое спасибо коллегам, которые помогали с информацией и указывали на неточности в статье, и отдельное спасибо borisblade за рисунки с Тирексом.