messages
Ниже приведен пример кода для извлечения сообщений из канала в Python.
- Он использует официальную библиотеку Python Slack и вызывает
conversations_history
спейджинг.Поэтому он будет работать с любым типом канала и при необходимости может извлекать большое количество сообщений. - Результат будет записан в файл в виде массива JSON.
- Вы можете указать канал и максимальное сообщениеподлежит получению
потоков
Обратите внимание, что конечная точка conversations.history
не будет возвращать сообщения потоков.Они должны быть извлечены дополнительно одним вызовом conversations.replies
для каждого потока, для которого вы хотите получить сообщения.
Потоки можно определить в сообщениях для каждого канала, проверив threads_ts
свойство в сообщении.Если он существует, к нему присоединена нить.См. страницу для более подробной информации о том, как работают потоки.
IDs
Этот скрипт не заменяет идентификаторы именами.Если вам нужно, вот несколько советов, как это реализовать:
- Вам нужно заменить идентификаторы для пользователей, каналов, ботов, групп пользователей (если на платном плане)
- Вы можетеизвлекайте списки для пользователей, каналов и групп пользователей из API с
users_list
, conversations_list
и usergroups_list
соответственно, ботов нужно выбирать по одному с помощью bots_info (при необходимости) - ID встречаются во многихместа в сообщениях:
- свойство верхнего уровня пользователя
- свойство верхнего уровня bot_id
- как ссылка в любом свойстве, которое допускает текст, например,
<@U12345678>
для пользователей или <#C1234567>
дляканалы.Они могут встречаться в свойстве text
верхнего уровня, но также во вложениях и блоках.
Пример кода
import os
import slack
import json
from time import sleep
CHANNEL = "C12345678"
MESSAGES_PER_PAGE = 200
MAX_MESSAGES = 1000
# init web client
client = slack.WebClient(token=os.environ['SLACK_TOKEN'])
# get first page
page = 1
print("Retrieving page {}".format(page))
response = client.conversations_history(
channel=CHANNEL,
limit=MESSAGES_PER_PAGE,
)
assert response["ok"]
messages_all = response['messages']
# get additional pages if below max message and if they are any
while len(messages_all) + MESSAGES_PER_PAGE <= MAX_MESSAGES and response['has_more']:
page += 1
print("Retrieving page {}".format(page))
sleep(1) # need to wait 1 sec before next call due to rate limits
response = client.conversations_history(
channel=CHANNEL,
limit=MESSAGES_PER_PAGE,
cursor=response['response_metadata']['next_cursor']
)
assert response["ok"]
messages = response['messages']
messages_all = messages_all + messages
print(
"Fetched a total of {} messages from channel {}".format(
len(messages_all),
CHANNEL
))
# write the result to a file
with open('messages.json', 'w', encoding='utf-8') as f:
json.dump(
messages_all,
f,
sort_keys=True,
indent=4,
ensure_ascii=False
)