Страница 20 из 21
Re: Разборка SMS и отправка на e-mail
Добавлено: 12 июн 2023, 15:04
DyadyaGenya
pepelxl писал(а): ↑12 июн 2023, 14:02
Я уже ни черта не помню. Но кажется, что как раз в 7бит надо парсить отдельно и собирать вместе, а всё остальное надо собрать сначала, а потом парсить.
Парсить - это перекодировать символы в человеческий вид?
И что про мой код? Вылаживать сейчас или уже потом?
Re: Разборка SMS и отправка на e-mail
Добавлено: 12 июн 2023, 15:17
DyadyaGenya
И ещё, не напомните, как ещё отличать кодировку? Потому что пока встречал описание поля DCS только либо "00", либо "08". Если "00", то это вроде бы 7 бит. А если "08", то вроде как UCS2. Но вроде бы ж есть и другие кодировки. Да и как различить на каком конкретно языке написана смс? Это ж как-то связано с "08"?
Re: Разборка SMS и отправка на e-mail
Добавлено: 12 июн 2023, 15:19
pepelxl
1) да
2) готовое. Как видите вы ведёте монолог, сыромятина ни кого не интересует. Всё ждут готовое за спасибо и лайки.
Re: Разборка SMS и отправка на e-mail
Добавлено: 12 июн 2023, 18:12
DyadyaGenya
pepelxl писал(а): ↑12 июн 2023, 15:19
1) да
Связано с 8-ми битным кодированием или про парсить?
И может подскажите дополнительные параметры для определения языка смс и его кодирования?
Re: Разборка SMS и отправка на e-mail
Добавлено: 12 июн 2023, 20:42
pepelxl
Смс не содержит язык, оно или 7бит альфабет, или ucs2. Языки есть в cbm, но там совершенно другая структура. 8бит не используют для передачи текстовых смс.
Re: Разборка SMS и отправка на e-mail
Добавлено: 13 июн 2023, 23:23
DyadyaGenya
pepelxl писал(а): ↑12 июн 2023, 20:42
Смс не содержит язык, оно или 7бит альфабет, или ucs2.
Тоесть поле DCS может быть только либо "00", либо "08"
pepelxl писал(а): ↑12 июн 2023, 20:42
8бит не используют для передачи текстовых смс
Возможно я не верно выразился, но я думал, что UCS2 это 8 бит или 16 бит. Да и у вас в файле
functionMTI написано "# Тип кодировки сообщения (7-bit, 8-bit, UCS2)"
pepelxl писал(а): ↑30 май 2020, 10:56
содержимое functionMTI
Код: Выделить всё
# Тип кодировки сообщения (7-bit, 8-bit, UCS2)
Хорошо, а про алгоритм перекодировки с вот этого UCS2 на удобочитаемый, можете пояснить? В него сразу кодируется или нужно как-то сперва в 7 бит перегонять, а потом уже в этот UCS2? Или как?
И ещё, этот вот альфабет отличается от той кодировки, что в микротике? Вроде как читал, что в микротике для вывода в терминал какая-то CP1252 применяется.
Да, и ещё хотелось уточнить. Поле
TP-UDL - длина смс. Как оно пересчитывается? Я понимаю, что для варианта 7бит пересчет один, а для UCS2 - другой. Но все же. Пробовал разбирать смс с помощью программки PDUspy. Там эта длина измеряется либо в септетах, либо в октетах
Re: Разборка SMS и отправка на e-mail
Добавлено: 14 июн 2023, 08:30
pepelxl
У вас до сих пор полная каша в голове по кодировкам.
Поле dcs описано в документе gsm3.38. на все биты и варианты. И по факту половину из них я встречал.
Как считается длинна пользовательских данных описано в соседнем документе(кажется gsm3.40). Какие символы может выводить mikrotik в терминал указано в wiki микротиков( условно заявлено только печатные символы английской раскладки, остальное на ваш страх риск). То есть даже влезут не все символы от альфабета. Ucs2 имеет фиксированную длинну в 2 байта.
Re: Разборка SMS и отправка на e-mail
Добавлено: 14 июн 2023, 10:00
DyadyaGenya
pepelxl писал(а): ↑14 июн 2023, 08:30
У вас до сих пор полная каша в голове по кодировкам.
Да я не спорю. Я ж только стал разбираться с этим вопросом. Потому так много уточнений задаю.
И все же, по поводу кодировки хотел уточнить, где и в чем я вас не правильно понимаю:
pepelxl писал(а): ↑12 июн 2023, 20:42
8бит не используют для передачи текстовых смс.
и
pepelxl писал(а): ↑30 май 2020, 10:56
Код: Выделить всё
# Тип кодировки сообщения (7-bit, 8-bit, UCS2)
Текстовое сообщение - это же текст в PDU формате, тоесть текст смс? Или это идет речь не про PDU режим, а про текстовый режим работы модема?
pepelxl писал(а): ↑14 июн 2023, 08:30
Поле dcs описано в документе gsm3.38. на все биты и варианты. И по факту половину из них я встречал.
К сожалению я ещё плохо понимаю этот документ. Есть подвижки, но медленно. Если бы ещё был вариант на русском )))) возможно было бы быстрее. При этом встречал значение 10 и 18. Тоесть это какие-то другие кодировки
Re: Разборка SMS и отправка на e-mail
Добавлено: 14 июн 2023, 12:01
pepelxl
берём актуальную версию от организации следящим за стандартом
https://www.etsi.org/deliver/etsi_ts/10 ... 70200p.pdf
открываем станицу 6 и 7, и глазеем до тех пор, пока не наступит прозрение. Все байты которые будут находится после поля dcs будут зависеть от битов в этом поле. НИ какого русского НЕ будет, и пока НЕ наступит полное просветление, дальше вы НИ в чём разобраться не сможете.
Re: Разборка SMS и отправка на e-mail
Добавлено: 15 июн 2023, 14:07
DyadyaGenya
pepelxl писал(а): ↑14 июн 2023, 12:01
НИ какого русского НЕ будет, и пока НЕ наступит полное просветление, дальше вы НИ в чём разобраться не сможете.
А в терминале микротика вообще есть способ вывести кирилический текст? Я не говорю про смс. Имеется ввиду вообще, кирилица в терминале микротика возможна? Вообще, что-то кроме латиницы в терминале возможно? Если да, то подскажите как, или хотя бы где прочитать