все о big data - Карьерные консультации
Username:
Password:

Добро пожаловать на форум YupTalk.ru!
Обсуждаем международную карьеру, профессиональный рост, бизнес-образование,
транснациональные корпорации, стажировки, консалтинг, финансы, аудит, маркетинг и работу в целом.


О САЙТЕ | РЕКЛАМА | ПРАВИЛА | КОНТАКТЫ | RSS ПОДПИСКА | | | БЛОГ

Подписка на все новые сообщения по почте:
Страницы: 1
  Печать  
Автор Тема: все о big data  (Прочитано 9075 раз)
maxmax
Новичок
*

Карма: 0
Оффлайн Оффлайн

Сообщений: 3


« : 22 Февраль 2016, 20:45:40 »

Добрый день.
Хочу встать на путь познания этой области. О себе - аудитор в биг4, образование экономическое. навыков программирования нет (кроме элементарных sql-курсов где-то и vba на ур-не новичка).
Расскажите, какие перспективы существуют в этой области в плане карьеры? Греф вот говорил недавно в интервью вроде, что Сбер тоже этим балуется. Скажите, как звучат вакансии в данной области в РФ? Есть ли вакансии такого рода в ИБ, консалтинге?
Посоветуйте литературу (не магистратуру), с которой можно было бы начать и к чему стремиться - хотелось бы услышать мнение не студентов, а практиков, которые работают в данной области.

Спасибо, я буду благодарен за ответы
Записан
Talledo
Новичок
*

Карма: 0
Оффлайн Оффлайн

Сообщений: 3


« Ответ #1 : 22 Февраль 2016, 21:02:24 »

У меня ситуация чем-то схожа с Вашей. Только я не в big4, а в финансах fmcg работаю. Если Вы совсем новичок в этой теме, то для ознакомления могу посоветовать книгу Data science from scratch (Joel Grus). Там кратко описывается что есть data science и основные направления в которых нужно копать, чтобы попасть в эту область. На счет того, как с этим в РФ подсказать не могу, я еще не на том этапе чтобы работу искать. Пока учу.
Записан
agon
VIP
Старожил
*

Карма: 26
Оффлайн Оффлайн

Сообщений: 289


« Ответ #2 : 22 Февраль 2016, 21:23:58 »

должности - ищи по тегам analyst, data scientist, data mining и русские производные. 
много набирают в IT, банки, ритейл. направление развивается, но есть своя специфика и сложности.
IB и консалтинг это вообще другой мир.
нельзя сразу научиться работе с big data по одной книге - изучай математику, python (можно и R), machine learning и т.д. источников слишком много.
На habrahabr попадаются интересные статьи, kaggle.com - вообще весь форум читай.
Записан
maxmax
Новичок
*

Карма: 0
Оффлайн Оффлайн

Сообщений: 3


« Ответ #3 : 23 Февраль 2016, 07:15:49 »

почему там другой мир?
с питона начать? почему можно и R? а можно и не изучать его?

какая специфика и сложности, подскажите?
математику просто так изучать - это без практики все забывается. в универе учил, к амер экзам готовился в свое время по математике, а сейчас все забыл..

спасибо за отклик

должности - ищи по тегам analyst, data scientist, data mining и русские производные. 
много набирают в IT, банки, ритейл. направление развивается, но есть своя специфика и сложности.
IB и консалтинг это вообще другой мир.
нельзя сразу научиться работе с big data по одной книге - изучай математику, python (можно и R), machine learning и т.д. источников слишком много.
На habrahabr попадаются интересные статьи, kaggle.com - вообще весь форум читай.
Записан
maxmax
Новичок
*

Карма: 0
Оффлайн Оффлайн

Сообщений: 3


« Ответ #4 : 23 Февраль 2016, 07:18:44 »

Это круто, что схожая ситуация!

Расскажи, плиз, что сейчас учишь?
Спасибо за книгу, седня сяду, посмотрю.

У меня ситуация чем-то схожа с Вашей. Только я не в big4, а в финансах fmcg работаю. Если Вы совсем новичок в этой теме, то для ознакомления могу посоветовать книгу Data science from scratch (Joel Grus). Там кратко описывается что есть data science и основные направления в которых нужно копать, чтобы попасть в эту область. На счет того, как с этим в РФ подсказать не могу, я еще не на том этапе чтобы работу искать. Пока учу.
Записан
Talledo
Новичок
*

Карма: 0
Оффлайн Оффлайн

Сообщений: 3


« Ответ #5 : 23 Февраль 2016, 09:54:28 »

По одной книге конечно не научиться, но можно понять для начала твое ли это.

Вообще, изначально нужно понять, что без бэкграунда по статистике или программирования придется очень попотеть, чтобы чтобы все необходимое выучить.

Языки программирования:
1) R или Python (я выбрал python т.к. он более универсален и если его выучить, то можно использовать не только для анализа данных, но и для других задач)
2) SQL

Математика/статистика:
1) Теория вероятности
2) Математическая статистика
3) Линейная алгебра

Машинное обучение

Это далеко не полный список, сам пока на этапе повторения/изучения математической части и параллельно учу python

Тут у самого возникает вопрос, когда заканчивать учить и пытаться найти в этой области работу.

Записан
Maxer
Новичок
*

Карма: -13
Оффлайн Оффлайн

Сообщений: 12


« Ответ #6 : 23 Февраль 2016, 11:54:16 »

На Coursera недавно появился курс по машинному обучению от Вышки и Яндекса - https://www.coursera.org/learn/vvedenie-mashinnoe-obuchenie.
Вроде запускается каждый месяц.
Записан
Alfie
Новичок
*

Карма: 2
Оффлайн Оффлайн

Сообщений: 30



« Ответ #7 : 23 Февраль 2016, 12:24:13 »

http://www.alpinabook.ru/catalog/MarketingAdvertisingPR/2426292/

Вот еще свежая книга вышла. Я сам из другой стези, но для общего развития решил почитать. Еще не дочитал, но пока нравится, что повествование не слишком заумное, как во многих источниках, включая курсеру, где курсы начинаются с того, что нужно открыть R и начать лопатить какой-то код.
Записан
ouiz
VIP
Пользователь
*

Карма: 16
Оффлайн Оффлайн

Сообщений: 79


« Ответ #8 : 23 Февраль 2016, 12:25:04 »

Советую всем интересующимся сразу идти на kaggle.com и посмотреть на примере местных соревнований, какие вообще задачи можно решать в анализе данных. Может оказаться, что вам это совсем не интересно :)

После этого, вдохновлённым, уже можно осознанно закрывать необходимые бреши в образовании: теория вероятностей и статистика, python/R, типовые алгоритмы машинного обучения, распределённые вычисления и стек Hadoop.
Записан
ngoldo
Новичок
*

Карма: 0
Оффлайн Оффлайн

Сообщений: 1


« Ответ #9 : 23 Февраль 2016, 14:00:09 »

Для начала, обязательно пройдите курс от Andrew Ng. Если открывать MatLab (или Octave) и лопатить какой-то код вам не понравится — можете со спокойной душей забыть о ML и заняться чем-то более интересным.
Дальше, на Kaggle есть несколько учебных кейсов. Один из которых (Titanic) очень подробно разбирается на dataquest.io. Там вы сможете применить на практике линейную регрессию, логистическую регрессию и дерево принятия решений.
Только после этого я бы рекомендовал смотреть курс ШАДа. Иначе слишком много времени придется тратить на гугление Stack Owerflow.

Если есть возможность и желание отучиться два года, по этому направлению в РФ нет ничего лучше ШАД.

Если нет, стоит попробовать пробиться в топ Kaggle и занимать призовые места на локальных хакатонах.

На данный момент сложилась ситуация, когда Data Scientist'ы с Data Engineer'ами крайне востребованы, но хороших специалистов исчезающие мало. При этом есть большое количество Data Science Wannabe, которым найти работу в этой области непросто.
Записан
agon
VIP
Старожил
*

Карма: 26
Оффлайн Оффлайн

Сообщений: 289


« Ответ #10 : 23 Февраль 2016, 14:41:44 »

1. другой мир т.к. IB и консалтинг вообще о другом - разные требования к сотрудникам, разные задачи. нет смысла изучать big data и потом зацикливаться на вакансиях, где хватает продвинутого экселя
2. как уже писали выше - питон универсален и имеет достаточно простой синтаксис + есть очень удобные пакеты типа Pandas
3. в РФ всем вообще не упали эти большие данные. пока не совсем понятно как на этом делать деньги (если ты не билайн, который курсы по 100к впаривает) + для работы с большими данными нужны эти самые большие данные, а их еще собрать надо  :'(
4. для прохождения курса по машинному обучению нужна хорошая теоретическая база, там очень много математики и мало ее объясняют
5. Data Smart: Using Data Science to Transform Information into Insight - неплохо, но дорого
6. мне в свое время тут kaggle.com и посоветовали   :)
7. искать работу можно когда угодно, но нужно материалом владеть и иметь релевантные строчки в резюме. очень ценят ШАД и призовые места в соревнованиях kaggle
Записан
EvilIvan
Пользователь
**

Карма: 11
Оффлайн Оффлайн

Сообщений: 70


« Ответ #11 : 23 Февраль 2016, 22:15:14 »

как думаете, как сложно в данный момент найти удаленную работу/подработку по big data?
Записан
agon
VIP
Старожил
*

Карма: 26
Оффлайн Оффлайн

Сообщений: 289


« Ответ #12 : 23 Февраль 2016, 22:24:25 »

как думаете, как сложно в данный момент найти удаленную работу/подработку по big data?
открываешь соревнование на kaggle/где-то еще - занимаешь призовое место - получаешь много $$$  :)
Записан
Alpha
Новичок
*

Карма: 3
Оффлайн Оффлайн

Сообщений: 25


« Ответ #13 : 24 Февраль 2016, 07:50:18 »

Ну в ШАД надо ещё поступить (а вступительные туда очень интересные) и проучиться, вообще это одно из топовых мест.

Можешь посмотреть программу магистерской по Анализу данных в вышке, там есть учебный план и литература, можете заглянуть на программу по стохастике.

А какие цели вы преследуете, после б4 в анализе данных? Стандартные пути попадания, через мех-мат, фупм, мгту и т.д.
Т.е. люди качают мозги 5 лет матаном, алгеброй, теор.вером, и о да оптимизацией. После этой базы на интуитивном уровне чувствуется, что такое данные и зачем нужен анализ и как его можно структирировать. Это ведь новое направление, в котором необходима фундаментальная база, которая способна генерировать новые знания. Ведь в эти алгоритмы можно засунуть любые объекты(!)

Можно конечно закрывать вакансии по этому направлению, и будет получаться что-то типо, web - программиста, который боится мотематики и делает шаблонные вещи.
Записан
ouiz
VIP
Пользователь
*

Карма: 16
Оффлайн Оффлайн

Сообщений: 79


« Ответ #14 : 24 Февраль 2016, 09:36:55 »

Ну в ШАД надо ещё поступить (а вступительные туда очень интересные) и проучиться, вообще это одно из топовых мест.

Можешь посмотреть программу магистерской по Анализу данных в вышке, там есть учебный план и литература, можете заглянуть на программу по стохастике.

А какие цели вы преследуете, после б4 в анализе данных? Стандартные пути попадания, через мех-мат, фупм, мгту и т.д.
Т.е. люди качают мозги 5 лет матаном, алгеброй, теор.вером, и о да оптимизацией. После этой базы на интуитивном уровне чувствуется, что такое данные и зачем нужен анализ и как его можно структирировать. Это ведь новое направление, в котором необходима фундаментальная база, которая способна генерировать новые знания. Ведь в эти алгоритмы можно засунуть любые объекты(!)

Можно конечно закрывать вакансии по этому направлению, и будет получаться что-то типо, web - программиста, который боится мотематики и делает шаблонные вещи.
"Дорогу осилит идущий". Было бы желание - можно прокачиваться по ходу работы. Никакой магии в очном обучении нет.
Записан
Enigma19
Новичок
*

Карма: -3
Оффлайн Оффлайн

Сообщений: 1


« Ответ #15 : 17 Июль 2016, 19:06:38 »

как думаете, как сложно в данный момент найти удаленную работу/подработку по big data?

Ты не мог бы зайти в личку?))
Записан



Страницы: 1
  Печать  
 
Обычная тема
Популярная тема (более 75 ответов)
Очень популярная тема (более 100 ответов)
Заблокированная тема
Прикрепленная тема
Голосование