Тестирование вселенной акций - PullRequest
0 голосов
/ 21 декабря 2018

Я хотел бы разработать стратегию следования за трендом через бэк-тестирование множества акций;Давайте просто скажем все акции NYSE или S & P500.Я задаю этот вопрос сегодня, потому что я не уверен, как обращаться с хранением / организацией огромных объемов исторических данных о ценах.

После нескольких часов исследований я здесь, спрашиваю вашего опыта и осведомленности.Я был бы чрезвычайно признателен за любую информацию / осведомленность, которой вы можете поделиться по этой теме


Личный опыт:

-Я знаю, как кодировать.Я специализировался в электротехнике, а не в CS.

- Я знаю, как получить данные о запасах по отдельным тикерам в ExcelЗнаком с использованием фильтрации и пользовательских исследований ThinkOrSwim.

Прикладной контекст: С 1995 года по сегодняшний день позволяет оценивать наиболее эффективные акции на основе относительной силы / импульса.Мы постараемся сравнить многие технические характеристики для разработки стратегии.Ключом к этому является наличие данных по целому ряду акций, на которых мы можем проводить тесты на истории с использованием python, C #, R или любого другого языка кодирования.Затем мы можем определить возможные стратегии, оценивая доходность, коэффициент омега, среднюю избыточную доходность и альфа (измеренный еженедельно) входов и выходов Дженсена, которые обусловлены техническими требованиями.


Вот где у меня возникают проблемы с определением следующего шага:

- Загрузка данных для всех компаний S & P500 в единую книгу Excel просто не нужнабуду работатьЭто слишком много данных для Excel, чтобы справиться, я чувствую, как.Каждый тикер будет иметь несколько МБ данных о ценах.

-Какой лучший способ получить, а затем сохранить данные о ценах для каждого тикера во вселенной?Мы смотрим на что-то вроде доступа SQL или Microsoft здесь?Я не знаю;У меня недостаточно информации о том, как обрабатывать множество таких данных.Что ты думаешь?


Я использовал ToS для фильтрации акций на основе истинных / ложных параметров за период времени в прошлом;однако возможности ToS ограничены.Я хотел бы более гибкий движок тестирования на истории, такой как код, написанный на python или C #.Не уверен, что Rscript полезен.- Может быть, есть библиотеки, о которых я не знаю, которые сделали бы все это возможным?Если есть, дайте мне знать.

Я знаю, что Quantopia и другие веб-платформы Quant существуют повсюду.Это мои лучшие ставки на тестирование на истории?Есть мысли о них?


Я делаю это слишком сложным?Тестирование стратегии на одном эквити или нескольких акциях не является проблемой в Excel, ToS или даже Tradingview.Но с большим количеством данных, я не уверен, что лучший вариант для хранения этих данных, а затем использовать сценарий Python или что-то для выполнения обратного теста.


Случайная Заключительная мысль: - В конечном счете, хотелось бы изучить некоторую помощь ИИ с оптимизацией стратегий, которые были созданы на основе параметров.Я знаю, что это вещь, но не уверен, где узнать больше об этом.Пожалуйста, дайте мне знать.


Спасибо, ребята.Я надеюсь, что это было не слишком много.Если бы вы могли поделиться какими-либо знаниями, чтобы повысить мою осведомленность по этой теме, я был бы очень признателен.

Twitter: @ b_gumm

1 Ответ

0 голосов
/ 29 декабря 2018

Объем данных слишком велик для EXCEL или CALC.Даже если вы хотите просмотреть только 500 акций из S & P 500, вы получите 2,2 миллиона строк (примерно 220 дней / год * 20 лет * 500 акций).Для этого объема данных вы должны использовать базу данных SQL, такую ​​как MySQL.Он достаточно эффективен для обработки такого количества данных.Но вы должны найти способ обновления.Если вы ежедневно получаете полный временной ряд и сохраняете его в своей базе данных, этот процесс может занять ок.1 час.Вы также можете использовать дельта-загрузку, но знать о корпоративных действиях (например, разделение).

Я не знаю Quantopia, но я знаю похожий сервис тестирования на истории, где я создал скрипт тестирования на python в прошлом году.Результат сильно отличался от того, что я ожидал.Результатом исследования стало то, что служба тестирования на истории вычисляла неверные результаты из-за неверных данных.Так что будьте осторожны с результатами.

...