W dzisiejszym szybko rozwijającym się świecie analizujemy rozproszone źródła danych publikujące do gigabajtów danych każdego dnia, gromadząc je w ciągu kilku miesięcy do skali terabajtów. Rodzi to wyzwanie, w jaki sposób efektywnie przechowywać te rozproszone zbiory danych, zarówno w roboczych pamięciach podręcznych zapewniających szybki dostęp w czasie rzeczywistym, jak i w formach zarchiwizowanych, które można ponownie wykorzystać do analizy danych offline. W tym artykule przedstawiliśmy usługi przetwarzania, które muszą uzyskać dostęp do kilku zbiorów danych jednocześnie, aby uzyskać inteligentne wyniki fuzji danych, które są następnie udostępniane decydentom w czasie rzeczywistym. Ponieważ skuteczna analiza wszystkich wyników jest wyzwaniem, musimy znaleźć rozwiązanie, które przyspieszy i usprawni przetwarzanie. W tym przypadku projektujemy metodę wykorzystującą metatagi, aby skrócić czas przetwarzania i zmniejszyć obciążenie istniejących systemów. Metatagi zasadniczo definiują różne atrybuty plików danych i zapewniają nam opcje dostępu do plików na podstawie wybranych atrybutów. W proponowanym systemie lekka i ciężka semantyka są oddzielane na podstawie rozmiaru. Powyżej 10 są dodawane do listy wagi ciężkiej, a poniżej 10 są dodawane do listy wagi lekkiej.