Цифровая математика на языке r и excel что это
Язык R для пользователей Excel
Предисловие
В связи с карантином многие сейчас львиную долю времени проводят дома, и это время можно, и даже нужно провести с пользой.
В начале карантина я решил довести до ума некоторые проекты начатые несколько месяцев назад. Одним из таких проектов был видео курс “Язык R для пользователей Excel.” Этим курсом я хотел снизить порог вхождения в R, и немного восполнить существующий дефицит обучающих материалов по данной теме на русском языке.
Если всю работу с данными в компании, в котороый вы работаете принято по-прежнему вести в Excel, то предлагаю вам познакомится с более современным, и при этом совершенно бесплатным инструментом анализа данных.
О курсе
Курс проведёт вас через все операции анализа данных, от загрузки до визуализации готового результата.
Почему именно язык R, а не Python? Потому, что R функциональный язык, пользователям Excel на него перейти легче, т.к. не надо вникать в традиционное объектно-ориентированное программирование.
К каждому из уроков предусмотрен тест. Тест состоит как из теоритических вопросов так и из задач на программирование. Решать тесты или нет лично ваш выбор, но они однозначно помогут вам закрепить полученный в видео лекциях материал. Если вы застряли на какой-то из практических задач можно подсмотреть её решение в разделе с решениями.
Для кого этот курс
Думаю это понятно из названия, тем не менее опишу более подробно.
Курс ориентирован на тех, кто в работе активно использует Microsoft Excel и там же реализует всю работу с данными. В общем, если вы открываете приложение Microsoft Excel хотя бы раз в неделю то курс вам подойдёт.
Навыков программирования для прохождения курса от вас не требуется, т.к. курс ориентирован на начинающих.
Но, возможно начиная с 4 урока найдётся материал интересный и для активных пользователей R, т.к. основной функционал таких пакетов как dplyr и tidyr будет рассмотрен достаточно подробно.
Материалы к курсу
В каждом уроке есть ссылка на папку с материалами, и на каждый отдельный файл, так же в каждом из уроков вы найдёте пример рассмотренного в лекции кода.
Но, при желании вы можете скачать все материалы курса одним архивом.
Об авторе
Меня зовут Алексей Селезнёв, с 2008 года я являюсь практикующим аналитиком. На данный момент основной моей деятельностью является развитие отдела аналитики в агентстве интернет-маркетинга Netpeak.
Веду свой авторский Telegram и YouTube канал R4marketing. Буду рад видеть вас в рядах подписчиков.
Периодически публикую статью на различных интернет медиа, зачастую это Хабр и Netpeak Journal.
Неоднократно выступал на профильных конференциях по аналитике и интернет маркетингу, среди которых Матемаркетинг, GoAnalytics, Analyze, eCommerce, 8P и прочие.
Начиная с 2016 года всячески стараюсь популяризировать язык R среди русскоязычных аналитиков и маркетологов. Этот курс также был создан с этой целью.
Программа курса
Благодарности
Курс, и все сопутствующие материалы предоставляются бесплатно, но если у вас есть желание отблагодарить автора за этот видео курс вы можете перечислить любую произвольную сумму на этой странице.
Язык программирования R: ничего лишнего, только работа с данными
Правило 35: если в мире что-то существует, для этого уже придумали свой язык программирования. И работа с данными не исключение.
Язык R — главный конкурент Python для тех, кто занимается статистикой и анализом данных. Его используют в социальных и экономических науках для поиска причинно-следственных связей, сравнения выборок, создания наглядных отчётов и графиков.
Язык разработали учёные факультета статистики Оклендского университета. Сначала это был внутренний инструмент, но потом его сделали доступным для всех — уж очень удачным он получился.
Это важный момент: R разработан статистиками для статистиков — в нём уже есть популярные статистические тесты, методы анализа данных, удобные инструменты для построения графиков. Такие возможности есть далеко не во всех популярных языках общего назначения.
А специализированный язык R уверенно отвоёвывает себе место под солнцем: с 18-го места рейтинга TIOBE в 2016 году он поднялся на 8-ю строчку в январе 2021. Установить интерпретатор и рабочее окружение можно в любую современную операционную систему — MacOS, Linux, Windows.
Технический писатель. Любит рассказывать просто про сложные вещи.
Что под капотом
R — интерпретируемый объектно-ориентированный язык программирования. Что это значит? Функции или таблицы для него — это объекты, которые относятся к определённому классу (типу данных), а готовая программа исполняется сразу — строчка за строчкой. Компилировать код в исполняемый файл перед запуском не надо.
Синтаксис языка R прост и включает минимальный набор примитивных типов данных: символьные, числовые, логические и комплексные. Примитивные типы объединяются в более сложные. Например, тип вектор — это, по сути, список из нескольких объектов (чисел, строк и других). Числовые переменные могут принимать и особые значения: NaN (not a number — не число), Inf (infinity — бесконечность) и NA (not available — недоступно).
Самая популярная команда в R — чтение файла, потому что надо постоянно открывать и исследовать датасеты. Вот как она выглядит:
Кроме интерфейса командной строки, для R существуют графические пользовательские интерфейсы и интерактивные инструменты: они делают работу легче и приятнее, доступны бесплатно и распространяются под свободной лицензией GNU GPL. Вот самые популярные:
Что можно сделать с помощью R
Многие из этих функций подключаются с помощью библиотек. В стандартном пакете их около 20: например, stat для статистических тестов и graphics для простой визуализации. Дополнительные библиотеки можно скачать с сервера CRAN — в 2020 году их там было больше 16 тысяч. Среди них plotly для интерактивных графиков и tidyr для очистки данных — она помогает заполнить пропущенные значения в столбцах и сделать так, чтобы каждый столбец соответствовал только одной переменной.
Сравнение R с другими инструментами для работы с данными
Основные конкуренты R — это инструменты анализа данных без кода — Excel, Google Sheets, SPSS, Tableau, Power BI и другие. А также языки программирования — Python и Julia.
R, Python и Julia
Python — универсальный язык, на нём можно создавать полноценные приложения, а R сильнее в работе со статистикой, поэтому его любят в академических кругах. Аналитики в компаниях любят оба языка, хотя Python пока популярнее и порог входа в него ниже.
Сторонники Julia прочат своему фавориту славу убийцы Python. Но пока это довольно молодой язык — у него не такое сильное сообщество, гораздо меньше готовых рецептов, библиотек и документации — особенно на русском.
Кстати, на reddit есть интересный тред, а у нас — целая статья по выбору языка программирования для аналитики.
Язык R и готовые программные пакеты
Сила R и других языков программирования — в их гибкости. У программ типа Excel и Tableau есть ограничения: если вам не хватает функций, придётся ждать милости разработчиков, а специалист по R достаточно быстро может сделать кастомные отчёты и графики, сопоставить нужные данные. Ещё один плюс — язык программирования позволяет полноценно работать с Big Data и строить модели машинного обучения.
Язык R для пользователей Excel (бесплатный видео курс)
В связи с карантином многие сейчас львиную долю времени проводят дома, и это время можно, и даже нужно провести с пользой.
В начале карантина я решил довести до ума некоторые проекты начатые несколько месяцев назад. Одним из таких проектов был видео курс «Язык R для пользователей Excel». Этим курсом я хотел снизить порог вхождения в R, и немного восполнить существующий дефицит обучающих материалов по данной теме на русском языке.
Если всю работу с данными в компании, в котороый вы работаете принято по-прежнему вести в Excel, то предлагаю вам познакомится с более современным, и при этом совершенно бесплатным инструментом анализа данных.
Содержание
Если вы интересуетесь анализом данных возможно вам будут интересны мои telegram и youtube каналы. Большая часть контента которых посвящены языку R.
Ссылки
О курсе
Курс проведёт вас через все операции анализа данных, от загрузки до визуализации готового результата.
Почему именно язык R, а не Python? Потому, что R функциональный язык, пользователям Excel на него перейти легче, т.к. не надо вникать в традиционное объектно-ориентированное программирование.
На данный момент запланировано 13 видео уроков длительностью от 5 до 20 минут каждый.
Уроки будут открываться постепенно. Каждый понедельник я буду открывать доступ к новому уроку у себя на YouTube канале в отдельном плей листе.
Для кого этот курс
Думаю это понятно из названия, тем не менее опишу более подробно.
Курс ориентирован на тех, кто в работе активно использует Microsoft Excel и там же реализует всю работу с данными. В общем, если вы открываете приложение Microsoft Excel хотя бы раз в неделю то курс вам подойдёт.
Навыков программирования для прохождения курса от вас не требуется, т.к. курс ориентирован на начинающих.
Но, возможно начиная с 4 урока найдётся материал интересный и для активных пользователей R, т.к. основной функционал таких пакетов как dplyr и tidyr будет рассмотрен достаточно подробно.
Программа курса
Урок 1: Установка языка R и среды разработки RStudio
Дата публикации: 23 марта 2020
Ссылки:
Видео:
Описание:
Вступительный урок в ходе которого мы скачаем и установим необходимое программное обеспечение, и немного разберём возможности и интерфейс среды разработки RStudio.
Тест
Ссылка на тест для проверки знаний.
Урок 2: Основные структуры данных в R
Дата публикации: 30 марта 2020
Ссылки:
Видео:
Описание:
Этот урок поможет вам разобраться с тем, какие структуры данных есть в языке R. Мы подробно разберём векторы, дата фреймы и списки. Научимся их создавать и обращаться к их отдельным элементам.
Тест
Ссылка на тест для проверки знаний.
Урок 3: Чтение данных из TSV, CSV, Excel файлов и Google Таблиц
Дата публикации: 6 апреля 2020
Ссылки:
Видео:
Тест
Ссылка на тест для проверки знаний.
Урок 4: Фильтрация строк, выбор и переименование столбцов, пайпланы в R
Дата публикации: 13 апреля 2020
Ссылки:
Видео:
Также узнаем что такое пайпланы и как они помогают делать ваш код на языке R более читабельным.
Тест
Ссылка на тест для проверки знаний.
Урок 5: Добавление вычисляемых столбцов в таблицу на языке R
Дата публикации: 20 апреля 2020
Ссылки:
Видео:
Тест
Ссылка на тест для проверки знаний.
Урок 6: Группировка и агрегация данных на языке R
Дата публикации: 27 апреля 2020
Ссылки:
Видео:
Тест
Ссылка на тест для проверки знаний.
Урок 7: Вертикальное и горизонтальное объединение таблиц на языке R
Дата публикации: 4 мая 2020
Ссылки:
Видео:
Описание:
Этот урок поможет вам разобраться с операциями вертикального и горизонтального объединения таблиц.
Вертикальное объединение является аналогом операции UNION в языке запросов SQL.
Горизонтальное объединение пользователям Excel более известно благодаря функции ВПР, в SQL такие операции осуществляются оператором JOIN.
Основные функции которые мы рассмотрим:
Тест
Ссылка на тест для проверки знаний.
Урок 8: Оконные функции в R
Дата публикации: 11 мая 2020
Ссылки:
Видео:
Описание:
Оконные функции по смыслу похожи на агрегирующие, они также принимают на вход массив значений и проводят над ними арифметические операции, но в исходящем результате не изменяют количество строк.
Тест
Ссылка на тест для проверки знаний.
Урок 9: Вращение таблиц или аналог сводных таблиц в R
Дата публикации: 18 мая 2020
Ссылки:
Видео:
Описание:
Большинство пользователей Excel используют сводные таблицы, это удобный инструмент с помощью которого вы можете в считанные секунды превратить массив сырых данных в читабельные отчёты.
В этом уроке мы разберёмся с тем как вращать таблицы в R, и преобразовывать их из широко формата в длинный и наоборот.
Тест
Ссылка на тест для проверки знаний.
Урок 10: Загрузка JSON файлов в R и преобразование списков в таблицы
Дата публикации: 25 мая 2020
Ссылки:
Видео:
Описание:
JSON и XML являются чрезвычайно популярными форматами хранения и обмена информацией, как правило, за счёт своей компактности.
Но анализировать данные представленные в таких форматах сложно, поэтому их перед анализом необходимо привести к табличному виду, именно этому мы и научимся в данном видео.
Тест
Ссылка на тест для проверки знаний.
Урок 11: Быстрое построение графиков с помощью функции qplot()
Дата публикации: 1 июня 2020
Ссылки:
Видео:
Описание:
Пакет ggplot2 является одним из наиболее популярных средств визуализации данных не только в R.
Тест
Ссылка на тест для проверки знаний.
Урок 12: Построение графиков слой за слоем с помощью пакета ggplot2
Дата публикации: 8 июня 2020
Ссылки:
Видео:
Описание:
В уроке продемонстрирована вся мощь пакета ggplot2 и заложенной в него грамматики построения графиков слоями.
Мы разберём основные геометрии которые присутствуют в пакете и научимся накладывать слои для построения графика.
Тест
Ссылка на тест для проверки знаний.
Урок 13: Изменение элементов графика и применение тем в ggplot2
Дата публикации: 15 июня 2020
Ссылки:
Видео:
Тест
Ссылка на тест для проверки знаний.
Заключение
Я старался подойти к формированию программы курса максимально лаконично, выделить только самую необходимую информацию которая понадобится вам для того, что бы сделать первые шаги в изучении такого мощного инструмента анализа данных как язык R.
Курс не является исчерпывающим руководством по анализу данных с помощью языка R, но поможет вам разобраться со всеми необходимыми для этого приёмами.
Пока программа курса рассчитана на 12 недель, каждую неделю, по понедельникам я буду открывать доступ к новым урокам, поэтому рекомендую подписаться на YouTube канал, что бы не пропустить публикацию нового урока.
Бесплатный видеокурс «Язык R для пользователей Excel»
Alexey Seleznev
Статья подготовлена читателем Библиотеки программиста. Не стесняйтесь присылать материалы для публикации по кнопке + в верхней панели – тексты проходят редактуру, мы поможем сделать статью понятной для широкой аудитории.
В связи с карантином многие разработчики львиную долю времени проводят дома. Я решил потратить освободившееся время на проекты, начатые несколько месяцев назад, в том числе видеокурс «Язык R для пользователей Excel». Этим курсом я хотел снизить порог вхождения в R и немного восполнить существующий дефицит обучающих материалов по данной теме на русском языке.
О курсе
Почему именно R, а не Python? R – функциональный язык, поэтому пользователям Excel обычно на него перейти легче. На данный момент запланировано 12 видеоуроков длительностью от 5 до 20 минут каждый. Уроки будут открываться постепенно. Каждый понедельник я буду открывать доступ к новому уроку у себя на YouTube-канале в отдельном плейлисте.
Программа курса
Ниже я приведу программу курса с подробным описанием каждого урока.
Урок 1: Установка языка R и среды разработки RStudio: На вступительном уроке мы скачаем и установим необходимое программное обеспечение, обсудим возможности и интерфейс среды разработки RStudio.
Урок 2. Основные структуры данных в R. В этом уроке подробно разберём векторы, датафреймы и списки. Научимся их создавать и обращаться к их элементам.
Урок 11: Быстрое построение графиков с помощью функции qplot() (1 июня 2020). Пакет ggplot2 является одним из наиболее популярных средств визуализации данных не только в R. В этом уроке мы научимся построению простейших графиков с помощью функции qplot() и разберём все её аргументы.
Урок 12: Построение графиков слой за слоем с помощью пакета ggplot2 (8 июня 2020). В уроке продемонстрирована вся мощь пакета ggplot2 и заложенной в него грамматики построения графиков. Мы разберём основные геометрии которые присутствуют в пакете и научимся накладывать слои для построения графика.
Заключение
Курс не является исчерпывающим руководством по анализу данных с помощью языка R, но поможет разобраться с необходимыми для этого приёмами. Я старался подойти к формированию программы курса максимально лаконично, выделив самую необходимую информацию, которая понадобится для того, чтобы сделать первые шаги в изучении такого мощного инструмента анализа данных, как язык R.
Пока программа курса рассчитана на 12 недель. Каждую неделю, по понедельникам я буду открывать доступ к новым урокам. Соответствующие ресурсы вы найдёте по следующим ссылкам:
Расширяем возможности MS Excel 2010 c помощью R
Добрый день, уважаемые читатели.
Сегодня я хочу показать как можно связать возможности языка R и офисного пакета MS Excel 2010. Ниже я расскажу о том, как можно расширить функционал встроенного языка VBA с помощью функций R, а поможет мне в этом надстройка RExcel. Инструкцию по его установке можно без проблем найти в сети или на офф. сайте.
Постановка задачи и предварительные настройки
Для того, чтобы мы смогли использовать функции R из VBA необходимо в Excel открыть «редактор Visual Basic» (Alt + F11). После этого к проекту надо добавить модуль RExcelVBAlib, сделать это можно перейдя Tools->References и поставить галочку на нужном пункте.
Данный модуль содержит класс rinterface, посредством, которого и происходит взаимодействие составляющих нашей связки.
Для демонстрации я взял исходные данные по котировакам доллара с сайта «Финам» за период 16.12.2011 по 20.03.2014. Для примера на их основе средствами R построим график изменения ежемесячной цены открытия (‘OPEN’).
Основы работы с rinterface из RExcel
Для начала давайте напишем код на R, который будет выполнять поставленную задачу и сохраним его в файл, например agg_price.R (он нам понадобиться в дальнейшем).
Способ 1. Построчное выполнение команд функции.
Данный способ является самым простым для понимания и самым длинным по количеству строк кода. Код процедуры для него следующий:
Способ 2. Использование внешней функции для выводом графика.
Процедура для этого способа выглядит следующим образом: