Есть ли способ извлечь «НАЗВАНИЕ КОМПАНИИ», «НАЗВАНИЕ ЗАДАНИЯ» и «РАСПОЛОЖЕНИЕ ЗАДАНИЯ» из каждой строки строки ниже - PullRequest
1 голос
/ 12 мая 2019

Из каждой строки строки ниже я хочу извлечь название компании, должность и место работы. Есть ли способ сделать это? как шаблон не соответствует. Спасибо.

"Jerry (YC S17) Is Hiring Senior Software Dev, Data Engineer (Toronto/Remote)"

"Iris Automation Is Hiring an Account Executive for B2B Flying Vehicle Software"

"Strikingly (YC W13) is hiring in our Shanghai office"

"BuildZoom (YC W13) is hiring  help make remodeling cheaper"

"EquipmentShare (YC W15) Is Looking for an Experienced React Native Dev"

"Saleswhale (YC S16) AI Assistant Startup Is Hiring Customer Success Managers"

"Streak (YC S11) is profitable, well funded and hiring in Vancouver"

"Tesorio (YC S15) Is Hiring Engineering Managers, Senior Python Engineer"

"Checkr (YC S14) is hiring engineers to build the future of online trust"

"Rescale Is Hiring a Senior DevOps Engineer in San Francisco"

"Tremendous.com is hiring its first engineer"

"Remix is looking for a front-end engineer to help build better public transit"

"Atomwise (YC W15) Is Hiring a Senior Machine Learning Research Scientist in SF"

"Confident Cannabis (YC S15) Is Hiring Engineers"

"WaystoCap (YC W17) is hiring a software engineer in Spain"

"Smarking (YC W15) Is Hiring a Customer Service Manager"

"Sunsama (YC W19) Is Hiring a Senior Full Stack Engineer (RN/GraphQL/Node)"

"Pachyderm Raised $10M and Is Looking for a Senior Full-Stack Engineer"

"Picktrace (YC S15) is hiring a senior Android engineer"

"Segment is hiring engineers to create our developer platform"

"XIX Is Hiring a Senior Front End Engineer"

"Athelas (YC S16) is hiring software engineers"

"Dyneti (YC W19) is hiring software engineers"

"ZeroCater (YC W11) Is Hiring a Principal Engineer in SF: Must Love Food"

"Mux is looking for developers who want to help developers build better video"

"Munich, Germany: Demodesk (YC W19) Is Hiring Software Engineers"

"New Story (YC Nonprofit) Hiring a JavaScript Software Engineer"

"Quit Genius (YC W18) Is Hiring a Product Manager in London"

"Flexport is hiring senior engineers in SF  Come get to know us"

"OneSignal Is Hiring Ruby on Rails and DevOps Engineers in San Mateo"

************* Это то, что я хочу **************

Пример 1

«Джерри (YC S17) нанимает старшего разработчика программного обеспечения, инженера данных (Торонто / Дистанционное управление)»

Название компании: Джерри

Должность: Старший разработчик программного обеспечения, инженер данных

Расположение: Торонто / Пульт

Пример 2

«Remix ищет внешнего инженера, который поможет улучшить общественный транспорт»

Название компании: Remix

Должность: инженер-фронтовик

Расположение:

Пример 3

«Мюнхен, Германия: Demodesk (YC W19) нанимает разработчиков программного обеспечения»

Название компании: Demodesk

Должность: Инженер-программист

Расположение: Мюнхен, Германия

Ответы [ 3 ]

0 голосов
/ 13 мая 2019

Насколько мне известно, если шаблон не соответствует, чем мы не можем извлечь и извлечь данные из любой строки.это может сделать только человек, так как у него есть навыки понимания, или вам нужно реализовать ML.

0 голосов
/ 21 мая 2019

Мы можем легко использовать эти модели SPACY, CRF, StanfordNLP и LSTM. Тренируйтесь 70% и тестируйте на 30% данных. Я предпочитаю Двунаправленный-LSTM лучше всего подходит для этого.

0 голосов
/ 13 мая 2019
  1. Соберите большое количество примеров, подобных этим.100 000 или около того, вероятно, подойдут, но если вы сможете получить миллион образцов, это будет лучше.
  2. Разделите их вручную.Если вы можете себе это позволить, это будет намного быстрее, если вы распределите работу между интернами / механическими турками / и т. Д.
  3. Обучите модель ML своему набору данных.Не забудьте взять случайный выбор образцов для обучения / тестирования.Стремитесь к повышению точности до 90%, но также старайтесь не перегружать свои данные.
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...