जानें कि BigQuery पर CrUX डेटा को कैसे व्यवस्थित किया जाता है.
परिचय
Chrome UX Report (CrUX) का रॉ डेटा, BigQuery पर उपलब्ध है. यह Google Cloud पर होस्ट किया गया डेटाबेस है.
BigQuery पर CrUX की मदद से, उपयोगकर्ता सीधे तौर पर पूरे डेटासेट पर क्वेरी कर सकते हैं. यह डेटासेट 2017 से उपलब्ध है. उदाहरण के लिए, रुझानों का विश्लेषण करने, वेब टेक्नोलॉजी की तुलना करने, और डोमेन की परफ़ॉर्मेंस की तुलना करने के लिए.
डेटा को हर महीने के हिसाब से व्यवस्थित किया जाता है. साथ ही, इसमें कई खास जानकारी वाली टेबल भी होती हैं, ताकि डेटा को तेज़ी से ऐक्सेस किया जा सके.
BigQuery डेटा, CrUX डैशबोर्ड का आधार होता है. इसकी मदद से, एसक्यूएल क्वेरी लिखे बिना ही इस डेटा को विज़ुअलाइज़ किया जा सकता है.
डेटासेट ऐक्सेस करना
BigQuery का इस्तेमाल करने के लिए, Google Cloud खाता होना ज़रूरी है. साथ ही, आपको एसक्यूएल के बारे में बुनियादी जानकारी होनी चाहिए. BigQuery पर मौजूद CrUX डेटासेट को बिना किसी शुल्क के ऐक्सेस किया जा सकता है. साथ ही, फ़्री टियर की सीमाओं तक इसे एक्सप्लोर किया जा सकता है. यह फ़्री टियर, हर महीने रिन्यू होता है और इसे BigQuery उपलब्ध कराता है. इसके अलावा, Google Cloud के नए उपयोगकर्ताओं को साइन अप क्रेडिट मिल सकता है. इससे वे मुफ़्त टियर से ज़्यादा के खर्च को कवर कर सकते हैं. ध्यान दें कि Google Cloud प्रोजेक्ट के लिए क्रेडिट कार्ड की जानकारी देना ज़रूरी है. इसके बारे में जानने के लिए, मुझे क्रेडिट कार्ड की जानकारी क्यों देनी होगी? लेख पढ़ें.
अगर पहली बार BigQuery का इस्तेमाल किया जा रहा है, तो प्रोजेक्ट सेट अप करने के लिए यह तरीका अपनाएं:
- Google Cloud Console पर, प्रोजेक्ट बनाएं पर जाएं.
- अपने नए प्रोजेक्ट को "My Chrome UX Report" जैसा कोई नाम दें और 'बनाएं' पर क्लिक करें.
- मांगे जाने पर, बिलिंग की जानकारी दें.
- BigQuery पर CrUX डेटासेट पर जाएं
अब डेटासेट से क्वेरी की जा सकती हैं.
प्रोजेक्ट मैनेज करना
BigQuery पर CrUX डेटा, अगले महीने के दूसरे मंगलवार को रिलीज़ किया जाता है. हर महीने की जानकारी, chrome-ux-report.all
में नई टेबल के तौर पर रिलीज़ की जाती है. इसके अलावा, कई मेटेरियलाइज़्ड टेबल भी हैं. इनमें हर महीने के लिए खास जानकारी वाले आंकड़े दिए जाते हैं.
- `chrome-ux-report
टेबल स्कीमा के बारे में ज़्यादा जानकारी
हर देश और all
डेटासेट के लिए रॉ टेबल, साल और महीने के हिसाब से उपलब्ध कराई जाती हैं.
रॉ टेबल
रॉ टेबल का स्कीमा यहां दिया गया है:
origin
effective_connection_type
form_factor
first_paint
first_contentful_paint
largest_contentful_paint
dom_content_loaded
onload
layout_instability
cumulative_layout_shift
interaction_to_next_paint
round_trip_time
navigation_types
navigate
navigate_cache
reload
restore
back_forward
back_forward_cache
prerender
experimental
permission
notifications
time_to_first_byte
popularity
मटेरियलाइज़्ड टेबल का स्कीमा
मुख्य डाइमेंशन के हिसाब से, खास जानकारी वाले डेटा को आसानी से ऐक्सेस करने के लिए, मेटेरियलाइज़्ड टेबल उपलब्ध कराई जाती हैं. इसमें कोई हिस्टोग्राम नहीं दिया गया है. इसके बजाय, परफ़ॉर्मेंस के आकलन और 75वें पर्सेंटाइल की वैल्यू के हिसाब से, परफ़ॉर्मेंस डेटा को फ़्रैक्शन में इकट्ठा किया जाता है. इस उदाहरण में, metrics_summary
टेबल की कुछ लाइनों का उदाहरण दिखाया गया है:
yyyymm | origin | fast_lcp | avg_lcp | slow_lcp | p75_lcp |
---|---|---|---|---|---|
202204 | https://example.com | 0.9056 | 0.0635 | 0.0301 | 1600 |
202203 | https://example.com | 0.9209 | 0.052 | 0.0274 | 1400 |
202202 | https://example.com | 0.9169 | 0.0545 | 0.0284 | 1500 |
202201 | https://example.com | 0.9072 | 0.0626 | 0.0298 | 1500 |
इससे पता चलता है कि 202204 डेटासेट में, https://example.com
पर 90.56% असल उपयोगकर्ता अनुभव, एलसीपी के अच्छे स्कोर की ज़रूरी शर्तें पूरी करते हैं. साथ ही, एलसीपी के 75वें पर्सेंटाइल की वैल्यू 1,600 मि॰से॰ थी. यह पिछले महीनों की तुलना में थोड़ा कम है.
चार मटीरियलाइज़्ड टेबल उपलब्ध कराई गई हैं:
metrics_summary
- महीने और ओरिजिन के हिसाब से मुख्य मेट्रिक
device_summary
- महीने, ऑरिजिन, और डिवाइस टाइप के हिसाब से मुख्य मेट्रिक
country_summary
- महीने, ओरिजिन, डिवाइस टाइप, और देश के हिसाब से मुख्य मेट्रिक
origin_summary
- डेटासेट में शामिल सभी ऑरिजिन की सूची
metrics_summary
metrics_summary
टेबल में, हर ऑरिजिन और हर महीने के डेटासेट के लिए खास जानकारी वाले आंकड़े शामिल होते हैं:
yyyymm
- डेटा इकट्ठा करने की अवधि का महीना
origin
- साइट के ऑरिजिन का यूआरएल
rank
- कोर्स की लोकप्रियता के हिसाब से रैंकिंग (मार्च 2021 तक)
[small|medium|large]_cls
- सीएलएस थ्रेशोल्ड के हिसाब से ट्रैफ़िक का फ़्रैक्शन
[fast|avg|slow]_<metric>
- परफ़ॉर्मेंस थ्रेशोल्ड के हिसाब से ट्रैफ़िक का फ़्रैक्शन
[low|medium|high]_rtt
- आरटीटी थ्रेशोल्ड के हिसाब से ट्रैफ़िक का फ़्रैक्शन
p75_<metric>
- परफ़ॉर्मेंस मेट्रिक की 75वें पर्सेंटाइल की वैल्यू (मिलीसेकंड)
notification_permission_[accept|deny|ignore|dismiss]
- सूचना पाने की अनुमति से जुड़े व्यवहार का हिस्सा
[desktop|phone|tablet]Density
- डिवाइस के नाप या आकार के हिसाब से ट्रैफ़िक का हिस्सा
[_4G|_3G|_2G|slow2G|offline]Density
- कनेक्शन टाइप के हिसाब से ट्रैफ़िक का फ़्रैक्शन (इसकी गिनती
rtt
हिस्टोग्राम से की जाती है. ये हिस्टोग्राम फ़रवरी 2025 से उपलब्ध होंगे. इसमें ऑफ़लाइन कनेक्शन शामिल नहीं है) navigation_type_[navigate|navigate_cache|reload|restore|back_forward|back_forward_cache|prerender]
- नेविगेशन टाइप का फ़्रैक्शन
device_summary
device_summary
टेबल में, महीने, ओरिजिन, देश, और डिवाइस के हिसाब से एग्रीगेट किए गए आंकड़े शामिल होते हैं. metrics_summary
कॉलम के अलावा, इसमें यह भी शामिल है:
device
- डिवाइस का नाप या आकार
country_summary
country_summary
टेबल में, महीने, ओरिजिन, देश, और डिवाइस के हिसाब से एग्रीगेट किए गए आंकड़े शामिल होते हैं. metrics_summary
कॉलम के अलावा, इसमें यह भी शामिल है:
country_code
- दो अक्षरों वाला देश का कोड
device
- डिवाइस का नाप या आकार
origin_summary
origin_summary
टेबल में, CrUX डेटासेट में मौजूद सभी ऑरिजिन की सूची होती है. यह हर महीने अपडेट होती है. इसमें डेटासेट में मौजूद ऑरिजिन की नई सूची होती है. इसमें सिर्फ़ एक कॉलम होता है: origin
.
एक्सपेरिमेंट के लिए डेटासेट
एक्सपेरिमेंट वाले डेटासेट में मौजूद टेबल, डिफ़ॉल्ट YYYYMM
टेबल की सटीक कॉपी होती हैं. हालांकि, इनमें BigQuery की नई और ज़्यादा बेहतर सुविधाओं का इस्तेमाल किया जाता है. जैसे, पार्टिशनिंग और क्लस्टरिंग. इनकी मदद से, कम समय में, आसानी से, और कम लागत में क्वेरी लिखी जा सकती हैं.
country
experimental.country
डेटासेट में, country_CC
डेटासेट से इकट्ठा किया गया डेटा शामिल होता है. साथ ही, इसमें डेटासेट की तारीख के लिए एक अतिरिक्त yyyymm
कॉलम होता है. यह स्कीमा, रॉ टेबल के जैसा ही होता है. इसमें तारीख और country_code
कॉलम जोड़े जाते हैं. इससे, हर महीने की टेबल को जोड़े बिना, समय के साथ देश के हिसाब से तुलना की जा सकती है.
global
experimental.global
डेटासेट में, all
डेटासेट से इकट्ठा किया गया डेटा शामिल होता है. साथ ही, इसमें डेटासेट की तारीख के लिए एक अतिरिक्त yyyymm
कॉलम होता है. इसका स्कीमा, रॉ टेबल के जैसा ही होता है. इसमें तारीख की जानकारी भी शामिल होती है. इससे, समय के साथ तुलना करने वाली क्वेरी को हर महीने की टेबल को जोड़े बिना ही चलाया जा सकता है.