Ищете набор данных для управления активами и активами - PullRequest
0 голосов
/ 01 марта 2019

Ищете набор данных для управления активами и / или имуществом, чтобы использовать некоторые алгоритмы машинного обучения, какие-либо идеи, где я могу его получить, пробовали Kaggle и Google, но без особой удачи?

1 Ответ

0 голосов
/ 02 марта 2019

10 лучших сайтов для загрузки наборов данных для проекта машинного обучения

Набор данных - это набор данных, который в основном хранится в матрице данных или в формате базы данных.Каждый Data Scientist нуждается в соответствующем наборе данных для создания проекта машинного обучения.Как сам энтузиаст машинного обучения, я считаю, что данные - это душа проекта машинного обучения, поэтому важно выбрать идеальный набор данных для его правильного использования.Вот некоторые из лучших сайтов и некоторые из моих личных любимых;Я часто использую для загрузки наборов данных.

Топ-10 порталов наборов данных в 2018 году

1 Kaggle Datasets Мой личный любимый и один из лучших поддерживаемых веб-сайтов с огромным количеством доступных данных.Наряду с поставщиком данных, этот сайт известен многими онлайн-конкурсами по науке о данных и машинному обучению и облачным рабочим столом для ученых и исследователей данных.Kaggle превратился в огромную агломерацию, работающую в науке о данных под различными подтемами.Это также крупнейшее в мире онлайн-сообщество исследователей данных.С простыми в использовании поисковыми опциями и вариантами выбора он определенно становится лучшим в лиге.

2 Набор данных IMDB Изобилие наборов данных, связанных с фильмами, можно найти, связанных с гигантским информационным гигантом IMDB (База данных фильмов в Интернете).).Мы получаем лучшие данные о фильмах как по количеству, так и по качеству.Лучше всего для проектов системы рекомендаций к фильмам, например: система рекомендаций к фильмам, основанная на ранее предоставленных обзорах пользователя и многих других.

3 Репозиторий машинного обучения UCI Это любезно предоставлено Калифорнийским университетом, Ирвинв 1987 году. Предоставляет исправленные данные для проектов в областях, связанных с машиной.Это огромная коллекция баз данных, доменных теорий и генераторов данных.Благодаря широкой популярности среди студентов, специалистов, преподавателей и исследователей во всем мире, хранилища цитировались более 1000 раз.

Наборы данных правительства США Правительство США предоставляет бесплатный доступ ко многим своим онлайн-каталогам и наборам данных для целей исследований и разработок.Это один из лучших источников, предоставляющий огромное количество данных в одном месте.С более чем 18 тысячами наборов данных «.csv» и многими другими базами данных сайт приобрел огромную популярность.Это полезно для специалистов по данным, а также для исследователей в области машинного обучения.

5 Открытая платформа данных правительства Индии Одним из самых крутых и интерактивных веб-сайтов за всю историю является платформа поставщика данных, поддерживаемая правительством Индии.Представленные данные полезны для аналитиков данных и проблем глубокого обучения и машинного обучения.Он известен своими аутентичными и высокопоставленными данными, доступными в Интернете.Большая часть данных связана с переписью и статистикой индийского субконтинента.

6 Наборы данных Yelp Yelp является одним из крупнейших сайтов для обзора в США.Он содержит более 6 миллионов отзывов для сотен тысяч ресторанов и предприятий.Его можно использовать в анализе настроений и технологиях майнинга вместе с системами рекомендаций.Он содержит подвал с отзывами, пользователями, советами, данными о регистрации, а также бизнес-данными, которые помогут получить представление о данных.

7 Reddit Opendata и наборы данных Открытые данные Reddit предоставляют комментарии, созданные данные для всех.Он предоставляет доступ к различным открытым наборам данных в Reddit.reddit.com/r/datasets/ предоставляет общие наборы данных для различных тем, таких как визуализация и машинное обучение.

8 Наборы данных Youtube Созданные Youtube, это лучшее место для получения набора видеоданных.Он состоит из более 8 миллионов идентификаторов видео и ярлыков.Поскольку мы знаем, что Youtube - лучший источник для предоставления развлечений на основе видео, здесь вы получаете множество наборов видеоданных.Эти наборы данных лучше всего подходят для создания связанных с видео проектов в области машинного обучения и глубокого обучения.

9 Набор данных Keel KEELнабор данных - это хранилище наборов данных с открытым исходным кодом, откуда мы можем загрузить любой из перечисленных наборов данных.Набор данных KEEL используется многими исследователями в области машинного обучения, работающими по таким темам, как полууправляемая классификация, неконтролируемое обучение, регрессия и временные ряды.

10 Портал открытых данных Европейского союза (ЕС) Европейский союз открытые данныеВеб-сайт идеально подходит для загрузки наборов данных, связанных со странами ЕС.Имея около 13 тыс. Наборов данных в хранилище, это одно из наименее известных, но также и одно из лучших мест назначения для ученых-данных.

Загрузить набор данных

Проект машинного обучения не может быть реализован безиспользуя данные хорошего качества.Эти веб-сайты предоставляют нам бесплатные данные для загрузки для любого личного или профессионального проекта, а также для исследований.Есть много вариантов, доступных для выбора в Интернете;здесь я перечислил некоторые из лучших вариантов для создания проекта машинного обучения.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...