14.01.2021, 13:59 | #61 |
Боец
|
Цитата:
Сообщение от mazzy
эээээ. а зачем выгружать 10К адресов?
выгрузи только те, что относятся к измененным клиентам. ты говоришь: * клиенты используют адреса в FK * это бизнес локика наверняка заложена и в Аксапте и во внешней системе * значит с огромной вероятностью во внешней системе будут заданы constraints на адресе * это значит, чтобы приемник смог принять без ошибок, система источник ДОЛЖНА сначала передать адреса, а уж потом клиентов. * будет ли источник передавать сначала все 10К изменившихся адресов или будет как то приоретизировать... вопрос реализации, а не вопрос подхода. и я сильно подозреваю, что этот вопрос уходит сильно за рамки исходного вопроса. говорю жеж, подумай еще раз. там много соображений, относящихся к бизнес-логике и к инфраструктуре, а не к кодингу. кодинг - не так уж и сложен в этой задаче. а прикинь есть еще удаление. и на приемнике может присутстовать каскадное удаление данных 1. Мне нужно выгрузить клиентов с их адресами и контаками. Мне не нужно выгружать по-отдельности клиентов, адреса и контакты (в этом случае порядок важен, но соблюсти его технически невозможно). Т.е. ещё раз - минимальной единицей экспорта является посылка с подарками, а не коробка и подарки по-отдельности. 2. Так в этом суть задачи - среди множества изменившихся 10К адресов найти 5 клиентов, кторые подлежат выгрузке. Как? |
|
|
За это сообщение автора поблагодарили: EVGL (3). |
14.01.2021, 14:14 | #62 |
Участник
|
Цитата:
Сообщение от DSPIC
Так-с давай синхронизируемся.
1. Мне нужно выгрузить клиентов с их адресами и контаками. Мне не нужно выгружать по-отдельности клиентов, адреса и контакты (в этом случае порядок важен, но соблюсти его технически невозможно). Т.е. ещё раз - минимальной единицей экспорта является посылка с подарками, а не коробка и подарки по-отдельности. насколько я понимаю у автора топика был другой вопрос... и я отвечал про справочник. ну и фиг с ним. давай поговорим о DataEntity. Цитата:
в контексте DataEntity нужно записи в подчиненных таблицах, которые связаны с главной: есть 5 клиентов - надо найти адреса, относящиеся к каждому из них т.е. в рамках кода, который выгружает клиентов нужно сделать запрос к адресам, которые связаны с передаваемым клиентом и только для этих адресов проверить - изменились ли они. И тут... Классический DataEnity предполагает, что в DataEntity содержатся все данные, относящиеся к главной. Т.е. DataEnity - это конечное целевое состояние которое должно быть у главной записи. (по крайней мере я так понимаю подход с DataEnity) В рамках такого подхода DataEnity, можно ли с логической точки зрения передавать изменения в подчиненных таблицах? Не будет ли принимающая сторона трактовать отсутствующие в DataEnitity записи как команду удалить, все что не перечислено в DataEnity? Понятно, что если и источник, и приемник контролируются одной командой разработки, то может быть всё что угодно. Но как правило команда не одна. И я бы не рассчитывал, что в DataEnity можно передавать отличия, а не конечное целевое состояние. ======= Другими словами, 1. если Клиенты и Адреса - выгружаемые справочники, то рано или поздно система источник все равно должна выгрузить все данные. Причем выгрузка должна учитывать, что приемник может содержать constraints на бизнес-логику 2. если клиенты+адреса - это DataEnitity, то совершенно не обязательно выгружать все адреса (DataEnitity никогда этого и не делает). Но вот можно ли выгружать в DataEnitity только изменившиеся адреса - большой вопрос, требующий согласования на уровне публичных интерфейсов между системами. Насколько я понимаю, предполагается, что DataEnitity дложна содержать все данные, относящиеся к главной записи. Последний раз редактировалось mazzy; 14.01.2021 в 14:18. |
|
14.01.2021, 14:30 | #63 |
Участник
|
и давайте попробуем вернуться к исходному вопросу:
Выгрузка измененных клиентов во внешнюю систему начнем с того, что сама по себе выгрузка нафиг никому не нужна. нужна синхронизация нескольких взаимосвязанных систем. поскольку вопрос был про выгрузку, то скорее в вопросе можно рассматривать связи в топологии звезда причем для упрощения обсуждения можно считать, что вопрос относился к центральной системе в топологии звезда причем нужна синхронизация данных в этих связанных системах, а не одна только выгрузка. синхронизацию (выгрузку и загрузку) могут делать разные команды на разных языках и с разными представлениями. перед синхронизацией не стоит задача нахождения глобального минимума передаваемых данных. синхронизация может передавать данные и повторно. но чем меньше трафик, тем лучше. так, вот прежде всего, нужно понимать, что: 1. к выгрузке будет и парная операция - загрузка. 2. загрузка предполагает, что могут быть ограничения данных, которых нет в системе-источнике, но система источник должна учитывать эти ограничения 3. синхронизация справочников - рано или поздно все равно должна синхронизировать все данные справочников. нужно ли расставлять приоритеты и передавать записи в определенном порядке - вопрос конкретной реализации. но скорее всего порядок записей не важен - главное, чтобы все записи всех справочников рано или поздно были синхронизированы 4. однако с точки зрения бизнес логики порядок таблиц в выгрузке важен из-за constraints на принимающей системе 5. также с точки зрения бизнес логики важен порядок записей в таблицах, где реализован паттерн (id, parentid) из за constraints на принимающей системе 6. на принимающей стороне возможно реализованы каскадные удаления, которые система источник должна учитывать 7. на принимающей стороне возможны уникальные индексы, отличающиеся от уникальных индексов в системе источнике, поэтому некоторые insert/update могут не выполняться на принимающей стороне 8. и т.п. Последний раз редактировалось mazzy; 14.01.2021 в 14:38. |
|
|
За это сообщение автора поблагодарили: Vadik (1). |
14.01.2021, 14:37 | #64 |
Модератор
|
__________________
-ТСЯ или -ТЬСЯ ? |
|
14.01.2021, 14:52 | #65 |
Участник
|
Цитата:
Получается остается только решение предложенное DSPIC. Цитата:
Сообщение от Ace of Database
тут пишу про SysDatabaseLog потому что это прикольно и тоже работает.
PS: А D365FO как-то решает эту задачу? |
|
14.01.2021, 14:58 | #66 |
Участник
|
Цитата:
Сообщение от mazzy
начнем с того, что сама по себе выгрузка нафиг никому не нужна.
нужна синхронизация нескольких взаимосвязанных систем. поскольку вопрос был про выгрузку, то скорее в вопросе можно рассматривать связи в топологии звезда причем для упрощения обсуждения можно считать, что вопрос относился к центральной системе в топологии звезда Но в принципе интерестно обсудить как это более оптимально сделать. На первый взгляд такой протокол довольно гибкий, т.е. при добавлении к примеру новых полей в синхронизацию или добавлении новых групп клиентов они могут просто получить данные за более больший интервал(т.е. нет отдельной операции перевыгрузить все) Последний раз редактировалось trud; 14.01.2021 в 15:05. |
|
14.01.2021, 15:25 | #67 |
Участник
|
Цитата:
Будь проклят тот архитектор, который начал портить Аксапту с этого фреймворка Смотри: 1. с точки зрения бизнес-логики адреса - это не бесконечный список произвольных адресов, это вполне конретные адреса с определенной ролью - юридический адрес, адрес склада 1, адреса склада N, почтовый адрес и т.п. причем один и тот же адрес может использоваться для разных ролей адресов 2. в Аксапте какой то нехороший человек сделал универсальную таблицу (какой он молодец) 3. но я сильно сомневаюсь, что в системе приемнике адреса реализованы точно также Поэтому, с точки зрения бизнес-логики нужно синхронизировать адреса в разных ролях. если есть "запасные" адреса, то нужно очень четко синхронизировать primary и "остальные" адреса. (например, если зарегистрировано несколько адресов с ролью "юридический адрес", то выгрузить-и-загрузить нужно единственный, верный, указанный в уставе. например, если есть разные адреса доставки для разных отделов, то нужно выгрузить-и-загрузить правильные адреса для правильных ролей и с правильной принадлежностью) поэтому, задача "выгрузить-и-загрузить LogisticsPostalAddress, LogisticElectronicAddress" - это полный бред программистского подхода. нафиг это никому не нужно. нужно, чтобы в системе приемнике получились правильные адреса и правильной ролью и в правильных местах. хошь-не-хошь, а для выгрузки этой части DirParty придется делать интеграционную бизнес-логику, которая из универсальной таблицы (мать ее) расставит адреса в правильные места. Цитата:
Сообщение от trud
И простой связи с клиентом тоже нет, она идет через несколько джойнов. Т.е. можно сделать предположение что изменений адресов клиентов которых надо выгружать немного(это действительно так), но делать предположение что изменений всех адресов будет немного - это слишком сильно, может они вообще вбивают отдельные емейлы и телефоны для заказа
как скажешь. я не верю, что данные из dirParty можно и нужно синхронизировать универсальным однопроходным алгоритмом даже в случае аксапта-аксапта. для решения конкретной технической задачи "быстро, запросом узнать изменились ли записи в конкретной таблице с таким-то фильтром" вполне подойдет shadow-таблица как скажешь. Могу сказать только что DSPIC предлагает частный случай shadow-таблицы, в которой отбор идет по memo-полю без индекса. Но если остается только это. что ж поделать. как скажете Последний раз редактировалось mazzy; 14.01.2021 в 15:29. |
|
14.01.2021, 15:28 | #68 |
Участник
|
Цитата:
технической и внутренней задачи "найти измененные" влияет на внешний протокол обмена. но если это все что вы согласовали в протоколе то и не меняйте согласованную часть... |
|
14.01.2021, 15:59 | #69 |
Участник
|
Найти ближайшее решение, которое, при наименьшей гениальности, будет работать
X++: select top 1 * from decision where IsActive = 1 order by GeniusLevel
__________________
Мои утилиты для Аксапты версий 3.0-2012: http://aceofdatabase.blogspot.com/ |
|
14.01.2021, 16:08 | #70 |
Боец
|
Цитата:
Эмм... как скажешь |
|
14.01.2021, 17:34 | #71 |
Banned
|
Цитата:
0) Intercompany 1) В теории так легче синхронизироваться с CRM. В теории. 2) В самой таблице может быть тоже много общего, например между клиентом и поставщиком: название и юридическая форма, естественно, но и DUNS, номер в "ЕГРЮЛ", "ИНН" (меня регулярно разочаровывает, что в DirPartyTable нет VatNum). Недавно имел диагностику на клиенте, у которого почти каждый грузоотправитель одновременно и грузополучатель. |
|
14.01.2021, 17:49 | #72 |
Banned
|
К сожалению, отдельные поля не проверяются: либо все [подпадающее под фильтр], либо только CustTable, либо ничего. |
|
15.01.2021, 16:33 | #73 |
Модератор
|
Цитата:
https://youtu.be/XMWiN1mnw7c?t=234 Я не уверен что такая реализация взлетит. Для этого в общем случае надо хранить все изменения (в виде снэпшотов, или как-то еще) по достаточно крупной иерархической структуре (6М клиентов, 17М адресов плюс наверное столько же контактов и т.д.). Хранить и обновлять эту историю годами (так как мы не знаем как далеко назад во времени может потребоваться заглянуть) , и при этом искать по ней в несколько потоков десятками запросов в минуту ? Я бы не стал. Возможно, кастомное и спецализированное решение на X++ и заработает, но "просто, гибко, быстро" - тут наверное придется выбирать и даже не 2, а 1 из 3 Но если заработает, было бы интересно узнать что и как Цитата:
Но в принципе интерестно обсудить как это более оптимально сделать
__________________
-ТСЯ или -ТЬСЯ ? Последний раз редактировалось Vadik; 15.01.2021 в 16:52. |
|
15.01.2021, 17:39 | #74 |
Участник
|
Цитата:
хранить нужно поледнее отданное "состояние" в каждую систему-приемник. причем и "состояние" нужно только если передаются не все поля, как правило нужен только признак изменения данных - recVersion или хэш с фиксированной длиной. Цитата:
вроде исходный вопрос был "есть внешняя система, ей как-то надо передавать клиентов из АХ которые изменились за интервал времени." Цитата:
а в чем ты видишь проблему? |
|
15.01.2021, 17:41 | #75 |
Участник
|
Спасибо за комментарии.
По итогу оценил переделку в 3 дня, если согласуют, напишу чем закончилось. Это у них работает сейчас(с фильтром по "или" по дате модифиции по всем таблицам в запросе, я выше приводил пример), каждый вызов занимает минуту-полторы, подгружая в постоянном режиме где-то 6 ядер на 100% CPU, при этом большинство запросов возвращают пусто |
|
|
За это сообщение автора поблагодарили: vmoskalenko (4). |
18.03.2021, 13:33 | #76 |
Модератор
|
Пока
Дано: 5M клиентов более-менее равномерно (500К - 1.3М) распределены по 5 компаниям В сутки обновляется (Insert/Update) 0.1% клиентов Вопрос: что нам будет стоить идентицифировать обновленных клиентов с помощью Change tracking ? Потрачено времени:
Тестируем:
Итого: на бюджетной VM в Azure (B4Ms, 4xvCPU, 16 GB RAM, standard HDD) список измененных клиентов (CustTable.RecId) мы получаем за 5 секунд (достаточно шустро). Без перекрытия прочего стандартного кода в .insert(), .update(), event handler-ов и shadow таблиц (просто). Для всех обновлений, в том числе и извне AX (надежно)
__________________
-ТСЯ или -ТЬСЯ ? Последний раз редактировалось Vadik; 18.03.2021 в 15:48. |
|
|
За это сообщение автора поблагодарили: mazzy (5), trud (5), sukhanchik (6), gl00mie (5). |
18.03.2021, 14:15 | #77 |
Участник
|
Ну тест то как раз показывает что change tracking не всегда будет лучшим выбором. Т.е. никакие данные с точки зрения внешней системы вообще не изменились, а у вас выгрузились тысячи клиентов
Плюс все эти выгрузки полностью непрозрачны для пользователя, т.е. он не видит что и когда выгружалось Плюс сам тест очень простой. Если удалить к примеру e-mail будет работать? Клиентов как правило требуется выгружать не всех, а принадлежащей определенной группе(при этом группу у клиента можно менять), это поддерживается? |
|
18.03.2021, 15:35 | #78 |
Модератор
|
Цитата:
Цитата:
Плюс все эти выгрузки полностью непрозрачны для пользователя, т.е. он не видит что и когда выгружалось
Цитата:
Плюс сам тест очень простой
Цитата:
Если удалить к примеру e-mail будет работать?
Цитата:
Клиентов как правило требуется выгружать не всех, а принадлежащей определенной группе(при этом группу у клиента можно менять), это поддерживается?
Цитата:
Ну тест то как раз показывает что change tracking не всегда будет лучшим выбором
__________________
-ТСЯ или -ТЬСЯ ? Последний раз редактировалось Vadik; 25.03.2021 в 09:34. |
|
18.03.2021, 16:11 | #79 |
Участник
|
Так а что туда передавать? Ну т.е. вчера клиент принадлежал группе выгрузки и выгружался, сегодня ему поменяли группу на невыгружаемую. Нужно же как уведомить внешнюю систему об этом
Ну пока "insert(), .update() delete()" мне видится единственным правильный подходом, т.е. это будет гарантированно работать в любом случае, плюс позволит покрыть все возможные "хотелки" Хотя тут возможно ошибка выжившего, когда оно работает нормально, консалтинг не зовут, а мы видим только когда оно не работает |
|
18.03.2021, 16:26 | #80 |
Модератор
|
Цитата:
Цитата:
Ну пока "insert(), .update() delete()" мне видится единственным правильный подходом, т.е. это будет гарантированно работать в любом случае, плюс позволит покрыть все возможные "хотелки"
__________________
-ТСЯ или -ТЬСЯ ? |
|
Теги |
aif, ax2012, change tracking, интеграция, как правильно |
|
|