BigQuery पर CrUX

जानें कि BigQuery पर CrUX डेटा को कैसे व्यवस्थित किया जाता है.

परिचय

Chrome UX Report (CrUX) का रॉ डेटा, BigQuery पर उपलब्ध है. यह Google Cloud पर होस्ट किया गया डेटाबेस है.

BigQuery पर CrUX की मदद से, उपयोगकर्ता सीधे तौर पर पूरे डेटासेट पर क्वेरी कर सकते हैं. यह डेटासेट 2017 से उपलब्ध है. उदाहरण के लिए, रुझानों का विश्लेषण करने, वेब टेक्नोलॉजी की तुलना करने, और डोमेन की परफ़ॉर्मेंस की तुलना करने के लिए.

डेटा को हर महीने के हिसाब से व्यवस्थित किया जाता है. साथ ही, इसमें कई खास जानकारी वाली टेबल भी होती हैं, ताकि डेटा को तेज़ी से ऐक्सेस किया जा सके.

BigQuery डेटा, CrUX डैशबोर्ड का आधार होता है. इसकी मदद से, एसक्यूएल क्वेरी लिखे बिना ही इस डेटा को विज़ुअलाइज़ किया जा सकता है.

डेटासेट ऐक्सेस करना

BigQuery का इस्तेमाल करने के लिए, Google Cloud खाता होना ज़रूरी है. साथ ही, आपको एसक्यूएल के बारे में बुनियादी जानकारी होनी चाहिए. BigQuery पर मौजूद CrUX डेटासेट को बिना किसी शुल्क के ऐक्सेस किया जा सकता है. साथ ही, फ़्री टियर की सीमाओं तक इसे एक्सप्लोर किया जा सकता है. यह फ़्री टियर, हर महीने रिन्यू होता है और इसे BigQuery उपलब्ध कराता है. इसके अलावा, Google Cloud के नए उपयोगकर्ताओं को साइन अप क्रेडिट मिल सकता है. इससे वे मुफ़्त टियर से ज़्यादा के खर्च को कवर कर सकते हैं. ध्यान दें कि Google Cloud प्रोजेक्ट के लिए क्रेडिट कार्ड की जानकारी देना ज़रूरी है. इसके बारे में जानने के लिए, मुझे क्रेडिट कार्ड की जानकारी क्यों देनी होगी? लेख पढ़ें.

अगर पहली बार BigQuery का इस्तेमाल किया जा रहा है, तो प्रोजेक्ट सेट अप करने के लिए यह तरीका अपनाएं:

  1. Google Cloud Console पर, प्रोजेक्ट बनाएं पर जाएं.
  2. अपने नए प्रोजेक्ट को "My Chrome UX Report" जैसा कोई नाम दें और 'बनाएं' पर क्लिक करें.
  3. मांगे जाने पर, बिलिंग की जानकारी दें.
  4. BigQuery पर CrUX डेटासेट पर जाएं

अब डेटासेट से क्वेरी की जा सकती हैं.

प्रोजेक्ट मैनेज करना

BigQuery पर CrUX डेटा, अगले महीने के दूसरे मंगलवार को रिलीज़ किया जाता है. हर महीने की जानकारी, chrome-ux-report.all में नई टेबल के तौर पर रिलीज़ की जाती है. इसके अलावा, कई मेटेरियलाइज़्ड टेबल भी हैं. इनमें हर महीने के लिए खास जानकारी वाले आंकड़े दिए जाते हैं.

टेबल स्कीमा के बारे में ज़्यादा जानकारी

हर देश और all डेटासेट के लिए रॉ टेबल, साल और महीने के हिसाब से उपलब्ध कराई जाती हैं.

रॉ टेबल

रॉ टेबल का स्कीमा यहां दिया गया है:

  • origin
  • effective_connection_type
  • form_factor
  • first_paint
  • first_contentful_paint
  • largest_contentful_paint
  • dom_content_loaded
  • onload
  • layout_instability
    • cumulative_layout_shift
  • interaction_to_next_paint
  • round_trip_time
  • navigation_types
    • navigate
    • navigate_cache
    • reload
    • restore
    • back_forward
    • back_forward_cache
    • prerender
  • experimental
    • permission
      • notifications
    • time_to_first_byte
    • popularity

मटेरियलाइज़्ड टेबल का स्कीमा

मुख्य डाइमेंशन के हिसाब से, खास जानकारी वाले डेटा को आसानी से ऐक्सेस करने के लिए, मेटेरियलाइज़्ड टेबल उपलब्ध कराई जाती हैं. इसमें कोई हिस्टोग्राम नहीं दिया गया है. इसके बजाय, परफ़ॉर्मेंस के आकलन और 75वें पर्सेंटाइल की वैल्यू के हिसाब से, परफ़ॉर्मेंस डेटा को फ़्रैक्शन में इकट्ठा किया जाता है. इस उदाहरण में, metrics_summary टेबल की कुछ लाइनों का उदाहरण दिखाया गया है:

yyyymm origin fast_lcp avg_lcp slow_lcp p75_lcp
202204 https://example.com 0.9056 0.0635 0.0301 1600
202203 https://example.com 0.9209 0.052 0.0274 1400
202202 https://example.com 0.9169 0.0545 0.0284 1500
202201 https://example.com 0.9072 0.0626 0.0298 1500

इससे पता चलता है कि 202204 डेटासेट में, https://example.com पर 90.56% असल उपयोगकर्ता अनुभव, एलसीपी के अच्छे स्कोर की ज़रूरी शर्तें पूरी करते हैं. साथ ही, एलसीपी के 75वें पर्सेंटाइल की वैल्यू 1,600 मि॰से॰ थी. यह पिछले महीनों की तुलना में थोड़ा कम है.

चार मटीरियलाइज़्ड टेबल उपलब्ध कराई गई हैं:

metrics_summary
महीने और ओरिजिन के हिसाब से मुख्य मेट्रिक
device_summary
महीने, ऑरिजिन, और डिवाइस टाइप के हिसाब से मुख्य मेट्रिक
country_summary
महीने, ओरिजिन, डिवाइस टाइप, और देश के हिसाब से मुख्य मेट्रिक
origin_summary
डेटासेट में शामिल सभी ऑरिजिन की सूची

metrics_summary

metrics_summary टेबल में, हर ऑरिजिन और हर महीने के डेटासेट के लिए खास जानकारी वाले आंकड़े शामिल होते हैं:

yyyymm
डेटा इकट्ठा करने की अवधि का महीना
origin
साइट के ऑरिजिन का यूआरएल
rank
कोर्स की लोकप्रियता के हिसाब से रैंकिंग (मार्च 2021 तक)
[small|medium|large]_cls
सीएलएस थ्रेशोल्ड के हिसाब से ट्रैफ़िक का फ़्रैक्शन
[fast|avg|slow]_<metric>
परफ़ॉर्मेंस थ्रेशोल्ड के हिसाब से ट्रैफ़िक का फ़्रैक्शन
[low|medium|high]_rtt
आरटीटी थ्रेशोल्ड के हिसाब से ट्रैफ़िक का फ़्रैक्शन
p75_<metric>
परफ़ॉर्मेंस मेट्रिक की 75वें पर्सेंटाइल की वैल्यू (मिलीसेकंड)
notification_permission_[accept|deny|ignore|dismiss]
सूचना पाने की अनुमति से जुड़े व्यवहार का हिस्सा
[desktop|phone|tablet]Density
डिवाइस के नाप या आकार के हिसाब से ट्रैफ़िक का हिस्सा
[_4G|_3G|_2G|slow2G|offline]Density
कनेक्शन टाइप के हिसाब से ट्रैफ़िक का फ़्रैक्शन (इसकी गिनती rtt हिस्टोग्राम से की जाती है. ये हिस्टोग्राम फ़रवरी 2025 से उपलब्ध होंगे. इसमें ऑफ़लाइन कनेक्शन शामिल नहीं है)
navigation_type_[navigate|navigate_cache|reload|restore|back_forward|back_forward_cache|prerender]
नेविगेशन टाइप का फ़्रैक्शन

device_summary

device_summary टेबल में, महीने, ओरिजिन, देश, और डिवाइस के हिसाब से एग्रीगेट किए गए आंकड़े शामिल होते हैं. metrics_summary कॉलम के अलावा, इसमें यह भी शामिल है:

device
डिवाइस का नाप या आकार

country_summary

country_summary टेबल में, महीने, ओरिजिन, देश, और डिवाइस के हिसाब से एग्रीगेट किए गए आंकड़े शामिल होते हैं. metrics_summary कॉलम के अलावा, इसमें यह भी शामिल है:

country_code
दो अक्षरों वाला देश का कोड
device
डिवाइस का नाप या आकार

origin_summary

origin_summary टेबल में, CrUX डेटासेट में मौजूद सभी ऑरिजिन की सूची होती है. यह हर महीने अपडेट होती है. इसमें डेटासेट में मौजूद ऑरिजिन की नई सूची होती है. इसमें सिर्फ़ एक कॉलम होता है: origin.

एक्सपेरिमेंट के लिए डेटासेट

एक्सपेरिमेंट वाले डेटासेट में मौजूद टेबल, डिफ़ॉल्ट YYYYMM टेबल की सटीक कॉपी होती हैं. हालांकि, इनमें BigQuery की नई और ज़्यादा बेहतर सुविधाओं का इस्तेमाल किया जाता है. जैसे, पार्टिशनिंग और क्लस्टरिंग. इनकी मदद से, कम समय में, आसानी से, और कम लागत में क्वेरी लिखी जा सकती हैं.

country

experimental.country डेटासेट में, country_CC डेटासेट से इकट्ठा किया गया डेटा शामिल होता है. साथ ही, इसमें डेटासेट की तारीख के लिए एक अतिरिक्त yyyymm कॉलम होता है. यह स्कीमा, रॉ टेबल के जैसा ही होता है. इसमें तारीख और country_code कॉलम जोड़े जाते हैं. इससे, हर महीने की टेबल को जोड़े बिना, समय के साथ देश के हिसाब से तुलना की जा सकती है.

global

experimental.global डेटासेट में, all डेटासेट से इकट्ठा किया गया डेटा शामिल होता है. साथ ही, इसमें डेटासेट की तारीख के लिए एक अतिरिक्त yyyymm कॉलम होता है. इसका स्कीमा, रॉ टेबल के जैसा ही होता है. इसमें तारीख की जानकारी भी शामिल होती है. इससे, समय के साथ तुलना करने वाली क्वेरी को हर महीने की टेबल को जोड़े बिना ही चलाया जा सकता है.