CSV، انتظار: کاهش انتظار: کاهش XML بهترین پاسخ داده فرمت JSON که است?

آیا شما در حال ایجاد یک مشتری نازک (برنامه کاربردی وب) و یا ضخیم مشتری (مشتری و سرور برنامه) که برخی از شما اشاره ساخت احتمالا درخواست به سرور و اطلاعات خوبی برای پاسخ فرمت نیاز. تا به امروز، سه فرمت داده های بزرگ استفاده می شود به انتقال داده ها از سرور به مشتری وجود دارد: CSV، XML و JSON. به منظور توسعه یک برنامه کاربردی با معماری جامد, این ایده خوبی است برای درک تفاوت بین هر فرمت و زمانی که به استفاده از آنها است. هدف از این پست این است که تعریف هر فرمت داده ها روی سطح پخش کردن جوانب مثبت و منفی برای هر کدام و کشف آن شرایط بهترین کار با هر فرمت.

CSV

CSV مخفف “.csv”. همانطور که از اسمش پیداست، این فرمت داده ها در واقع فهرست عناصر با کاما جدا شده است. بیایید می گویند که خود را به فهرست افراد در خانواده خاص ارسال پاسخ است. قالب را مانند این نگاه: اریک

، آندره، Kusco

مزایا این فرمت فشرده از سه فرمت تمام است. به طور کلی فرمت های CSV حدود نیم سایز XML و JSON فرمت هستند. دلیل آن می تواند کمک به کاهش پهنای باند

این مزیت عمده CSV است فرمت منفی این همه کاره دست کم از سه فرمت تمام است. این به دلیل تجزیه کننده های خانگی مورد نیاز برای تبدیل داده ها CSV را به یک ساختار داده های بومی است. در نتیجه، اگر اطلاعات تغییرات ساختار، وجود دارد همراه سربار از نیاز به تغییر یا حتی طراحی مجدد خود parsers. از آنجا که برنامه ایجاد CSV و برنامه تجزیه CSV اقامت در دستگاه های مختلف (به یاد داشته باشید که ما داده ها از یک دستگاه به دیگری عبور) علاوه بر این، سپس برنامه های هر دو به طور همزمان برای جلوگیری از دریافت برنامه به تصادف باید بروز شود. در غیر این صورت، قطع برق مورد نیاز برای به روز رسانی برنامه های هر دو به صورت جداگانه برای جلوگیری از مسائل ناسازگاری است.

در نهایت، CSV واقعا سلسله مراتب داده ها پشتیبانی نمی کند. اگر شما می خواستم برای ارسال از ویژگی های پشت برای هر فرد در هر خانواده? شما پس از آن در طراحی تجزیه کننده پیچیده است که می داند کدام قسمت از CSV به عناصر خانواده اشاره و قطعات که دو عنصر هر فرد اشاره داشته باشد. یک راه برای حل این مشکل این است استفاده از حائل دیگری مانند “؛” ویژگی برای هر فرد جداگانه است: اریک

; نقاشی 26 آندره; زن; 26 Kusco; رنگ; 8

مشکل با ایجاد سفارشی فرمت، با این حال، است که شما متحمل سربار از حفظ تجزیه کننده پیچیده تر.

XML

XML مخفف زبان نشانه گذاری توسعه پذیر”” XML در سال 1996 طراحی شده بود و رسما استاندارد W3C در سال 1998 شد. آن است که به بهتر نشان دادن فرمت داده های با ساختار سلسله مراتبی ساخته شده است. قالب شبیه این:

<person> <name> اریک </name><br /> <age><br /> </age> </person> <person> <name><br /> 26 آندره </name><br /> <age><br /> 26 </age> </person> <person> <name><br /> Kusco </name><br /> <age><br /> 8 </age> </person>

فرمت جوانب مثبت این داده ها به طور کامل پشتیبانی از داده های سلسله مراتبی سازه و هنگام دریافت داده های پیچیده به عنوان پاسخ بسیار مناسب است. انسان بسیار هم قابل خواندن. اکثر مرورگرها در خوانندگان XML است که اجازه می دهد شما را به فایل های XML ساخته شده است. از XML قالب استاندارد داده های سلسله مراتبی اول بود، رابط های برنامه کاربردی بسیاری در عملکرد به طور خودکار تبدیل جریان داده های XML را به ساختمان داده های بومی به عنوان اشیاء ساخته شده است.

فرمت داده های منفی این سه بار به بزرگی CSV است. این است زیرا هر یک از عناصر داده ها همراه باز کردن و بستن تگ پارامتر است.

JSON

JSON مخفف (جاوا اسکریپت شیء نشان گذاری). در سال 2001 اختراع شد و توسط یاهو و گوگل در سال 2005 و 2006 محبوبیت شد. آن را به عنوان یک جایگزین برای XML ساخته شده است. مانند XML، با این حال، آن داده های سلسله مراتبی با استفاده از کاما گیومه، و داخل پرانتز نشان دهنده. مثال JSON شبیه این:

{“نام”: “اریک”، “سن”: “26”},
{“نام”: “آندریا”، “سن”: “26”},
{“نام”: “Kusco”، “سن”: “8”}

داده جوانب مثبت این فرمت پشتیبانی از داده های سلسله مراتبی در حالی که در اندازه کوچکتر از XML. به عنوان نام آن پیداست، آن هم ایجاد شده دو به آسانی تجزیه داده ها به اشیا بومی جاوا اسکریپت بسیار مفید برای برنامه های کاربردی وب ساخت. JSON است بهترین هر دو جهان CSV و کاپرفیلد. ساده و جمع و جور مثل CSV اما داده های سلسله مراتبی به عنوان XML را پشتیبانی می کند. بر خلاف XML، فرمت JSON است فقط در مورد دو بار به عنوان بزرگ به عنوان فرمت های CSV.

داده های منفی این قالب کمی کمتر پشتیبانی از XML است. از JSON نسبتا جدیدتر از XML، رابط های برنامه کاربردی کمتری به تبدیل خودکار JSON به ساختار داده های بومی وجود داشته باشد. از آنجا که رابط های برنامه کاربردی و افزونه های جدیدتر حمایت XML و JSON با این حال، این به سرعت در حال تغییر است.

نتیجه

به عنوان یک قاعده کلی کلی، JSON بهترین فرمت تبادل داده ها تا به امروز است. سبک وزن, جمع و جور و همه کاره است. CSV فقط باید استفاده شود اگر شما در حال ارسال مقدار بسیار عظیمی از داده ها و اگر پهنای باند مسئله است. چون آن بهتر مناسب برای سند markups امروز، XML به عنوان فرمت تبادل داده ها باید استفاده نمی شود.

laptop

آیا شما در حال ایجاد یک مشتری نازک (برنامه کاربردی وب) و یا ضخیم مشتری (مشتری و سرور برنامه) که برخی از شما اشاره ساخت احتمالا درخواست به سرور و اطلاعات خوبی برای پاسخ فرمت نیاز. تا به امروز، سه فرمت داده های بزرگ استفاده می شود به انتقال داده ها از سرور به مشتری وجود دارد: CSV، XML و JSON. به منظور توسعه یک برنامه کاربردی با معماری جامد, این ایده خوبی است برای درک تفاوت بین هر فرمت و زمانی که به استفاده از آنها است. هدف از این پست این است که تعریف هر فرمت داده ها روی سطح پخش کردن جوانب مثبت و منفی برای هر کدام و کشف آن شرایط بهترین کار با هر فرمت.

CSV

CSV مخفف “.csv”. همانطور که از اسمش پیداست، این فرمت داده ها در واقع فهرست عناصر با کاما جدا شده است. بیایید می گویند که خود را به فهرست افراد در خانواده خاص ارسال پاسخ است. قالب را مانند این نگاه: اریک

، آندره، Kusco

مزایا این فرمت فشرده از سه فرمت تمام است. به طور کلی فرمت های CSV حدود نیم سایز XML و JSON فرمت هستند. دلیل آن می تواند کمک به کاهش پهنای باند

این مزیت عمده CSV است فرمت منفی این همه کاره دست کم از سه فرمت تمام است. این به دلیل تجزیه کننده های خانگی مورد نیاز برای تبدیل داده ها CSV را به یک ساختار داده های بومی است. در نتیجه، اگر اطلاعات تغییرات ساختار، وجود دارد همراه سربار از نیاز به تغییر یا حتی طراحی مجدد خود parsers. از آنجا که برنامه ایجاد CSV و برنامه تجزیه CSV اقامت در دستگاه های مختلف (به یاد داشته باشید که ما داده ها از یک دستگاه به دیگری عبور) علاوه بر این، سپس برنامه های هر دو به طور همزمان برای جلوگیری از دریافت برنامه به تصادف باید بروز شود. در غیر این صورت، قطع برق مورد نیاز برای به روز رسانی برنامه های هر دو به صورت جداگانه برای جلوگیری از مسائل ناسازگاری است.

در نهایت، CSV واقعا سلسله مراتب داده ها پشتیبانی نمی کند. اگر شما می خواستم برای ارسال از ویژگی های پشت برای هر فرد در هر خانواده? شما پس از آن در طراحی تجزیه کننده پیچیده است که می داند کدام قسمت از CSV به عناصر خانواده اشاره و قطعات که دو عنصر هر فرد اشاره داشته باشد. یک راه برای حل این مشکل این است استفاده از حائل دیگری مانند “؛” ویژگی برای هر فرد جداگانه است: اریک

; نقاشی 26 آندره; زن; 26 Kusco; رنگ; 8

مشکل با ایجاد سفارشی فرمت، با این حال، است که شما متحمل سربار از حفظ تجزیه کننده پیچیده تر.

XML

XML مخفف زبان نشانه گذاری توسعه پذیر”” XML در سال 1996 طراحی شده بود و رسما استاندارد W3C در سال 1998 شد. آن است که به بهتر نشان دادن فرمت داده های با ساختار سلسله مراتبی ساخته شده است. قالب شبیه این:

<person> <name> اریک </name><br /> <age><br /> </age> </person> <person> <name><br /> 26 آندره </name><br /> <age><br /> 26 </age> </person> <person> <name><br /> Kusco </name><br /> <age><br /> 8 </age> </person>

فرمت جوانب مثبت این داده ها به طور کامل پشتیبانی از داده های سلسله مراتبی سازه و هنگام دریافت داده های پیچیده به عنوان پاسخ بسیار مناسب است. انسان بسیار هم قابل خواندن. اکثر مرورگرها در خوانندگان XML است که اجازه می دهد شما را به فایل های XML ساخته شده است. از XML قالب استاندارد داده های سلسله مراتبی اول بود، رابط های برنامه کاربردی بسیاری در عملکرد به طور خودکار تبدیل جریان داده های XML را به ساختمان داده های بومی به عنوان اشیاء ساخته شده است.

فرمت داده های منفی این سه بار به بزرگی CSV است. این است زیرا هر یک از عناصر داده ها همراه باز کردن و بستن تگ پارامتر است.

JSON

JSON مخفف (جاوا اسکریپت شیء نشان گذاری). در سال 2001 اختراع شد و توسط یاهو و گوگل در سال 2005 و 2006 محبوبیت شد. آن را به عنوان یک جایگزین برای XML ساخته شده است. مانند XML، با این حال، آن داده های سلسله مراتبی با استفاده از کاما گیومه، و داخل پرانتز نشان دهنده. مثال JSON شبیه این:

{“نام”: “اریک”، “سن”: “26”},
{“نام”: “آندریا”، “سن”: “26”},
{“نام”: “Kusco”، “سن”: “8”}

داده جوانب مثبت این فرمت پشتیبانی از داده های سلسله مراتبی در حالی که در اندازه کوچکتر از XML. به عنوان نام آن پیداست، آن هم ایجاد شده دو به آسانی تجزیه داده ها به اشیا بومی جاوا اسکریپت بسیار مفید برای برنامه های کاربردی وب ساخت. JSON است بهترین هر دو جهان CSV و کاپرفیلد. ساده و جمع و جور مثل CSV اما داده های سلسله مراتبی به عنوان XML را پشتیبانی می کند. بر خلاف XML، فرمت JSON است فقط در مورد دو بار به عنوان بزرگ به عنوان فرمت های CSV.

داده های منفی این قالب کمی کمتر پشتیبانی از XML است. از JSON نسبتا جدیدتر از XML، رابط های برنامه کاربردی کمتری به تبدیل خودکار JSON به ساختار داده های بومی وجود داشته باشد. از آنجا که رابط های برنامه کاربردی و افزونه های جدیدتر حمایت XML و JSON با این حال، این به سرعت در حال تغییر است.

نتیجه

به عنوان یک قاعده کلی کلی، JSON بهترین فرمت تبادل داده ها تا به امروز است. سبک وزن, جمع و جور و همه کاره است. CSV فقط باید استفاده شود اگر شما در حال ارسال مقدار بسیار عظیمی از داده ها و اگر پهنای باند مسئله است. چون آن بهتر مناسب برای سند markups امروز، XML به عنوان فرمت تبادل داده ها باید استفاده نمی شود.

آزمون نفوذ – چگونه برای جلوگیری از محدودیت دسترسی USB قرار داده شده توسط Active Directory؟

من به منظور مشارکت در محل برای دیدن آنچه که من می توانم از یکی از لپ تاپ های خود پیدا کنم. آنها یک سیاست برای جلوگیری از دسترسی USB از طریق Active Directory دارند، مثلا هنگامی که سعی می کنید به درایو USB دسترسی داشته باشید، دسترسی به آن را انکار می کنید، برای اطلاعات بیشتر اینجا را ببینید.

آیا راهی برای دور زدن این وجود دارد؟ آیا ابزارهایی مانند Bash Bunny همچنان کامیابی را اجرا می کنند، صرف نظر از اینکه من بتوانم به آن دسترسی پیدا کنم یا نه؟

دو نگرانی های بزرگ داده Hadoop اجرای خود

با توجه به آی بی ام بالا، ما ایجاد 2.5 quintillion کلمه در ادامه متن از داده ها در هر روز. سرچشمه این داده ها از همه حوزه های فعالیت و در همه جا: به نام تنها چند داده از سنسور و سایت های رسانه های اجتماعی و تصاویر دیجیتال و وب لاگ و معامله رکورد خرید آنلاین و غیره، آمده است.

به طور کلی داده را می توان به سه دسته طبقه بندی است. هر گونه اطلاعات است که می تواند در پایگاه داده های ذخیره شده را می توان به عنوان داده های ساخت یافته نامیده می شود. به عنوان مثال، معامله رکورد خرید آنلاین را می توان در پایگاه داده ذخیره شده است. از این رو، آن به عنوان داده های ساخت یافته نامیده می شود. برخی از داده ها تا حدی می تواند در پایگاه داده است که می تواند به عنوان داده های نیمه ساخت یافته نام ذخیره می شوند. به عنوان مثال، اطلاعات در پرونده XML تا حدی می تواند در پایگاه داده ذخیره می شود و می توانید آن را به عنوان داده های نیمه ساخت یافته نام.

اشکال دیگر داده است که به این دو دسته متناسب خواهد شد به عنوان داده های بدون ساختار نامیده می شوند. به نام چند، اطلاعات از سایت های رسانه های اجتماعی، وب لاگ تجزیه و فرآوری شده در پایگاه داده ذخیره می شود نمی باشد، بنابراین آن را به عنوان داده های بدون ساختار طبقه بندی است. اصطلاح دیگر مورد استفاده برای داده های بدون ساختار داده های بزرگ است.

با توجه به NASSCOM، داده های ساخت یافته حساب برای 10 درصد از داده ها است که امروز در اینترنت وجود دارد. این حساب 10 ٪ از داده های نیمه ساخت یافته و 80 درصد باقی مانده از داده ها در داده های بدون ساختار می آید. به طور کلی سازمان های استفاده از تجزیه و تحلیل ساخت یافته و نیمه ساخت یافته داده ها با استفاده از ابزارهای تجزیه و تحلیل داده های سنتی. هیچ ابزار پیچیده به تجزیه و تحلیل داده های بدون ساختار تا چارچوب نقشه را کاهش می دهد که توسعه یافته توسط گوگل وجود دارد. بعد، آپاچی، توسعه چارچوب نام “Hadoop” است که تجزیه و تحلیل این داده ها و اطلاعات است که کمک بزرگی برای کسب و کار تصمیم گیری بهتر را نشان می دهد.

Hadoop در حال حاضر اهمیت آن در مناطق مختلف ثابت شده است. به عنوان مثال، با توجه به NASSCOM، بسیاری از سازمان ها با استفاده از آنالیز داده های بزرگ آغاز شده است. ملی اقیانوسی و فضای اداری (NOAA)، شرکت های ملی هوانوردی و فضایی (NASA) و چند دارویی و انرژی شروع کرده اند با استفاده از آنالیز داده های بزرگ گسترده برای پیش بینی رفتار مشتریان خود را.

با توجه به تحقیقات اخیر از گروه Nemertes سازمان ارزش در تجزیه و تحلیل داده های بزرگ و برنامه ریزی به اهرم بهتر در دلیل بیم و مزایای تجزیه و تحلیل داده ها بزرگ. نیویورک تایمز با استفاده از داده های بزرگ ابزار برای تجزیه و تحلیل متن و شرکت والت دیزنی استفاده از آنها را به/با مرتبط و رفتار مشتری در همه فروشگاه ها و پارک آن را درک. شرکت های هندی آن مانند TCS Wipro Infosys و دیگر بازیکنان کلیدی نیز شروع به درو پتانسیل بسیار ممتازی برخوردار است که داده های بزرگ همچنان به ارائه.

این به وضوح نشان می دهد که داده های بزرگ منطقه ای نوظهور است و بسیاری از شرکت ها برای کشف فرصت های جدید را شروع کرده اند. در همین حال، استفاده از داده های بزرگ اثبات می شود ارزشمند است اما در همان زمان نیز ممکن است اشاره کرد که حفاظت از حریم خصوصی و داده ها نگرانی های خود را نیز افزایش یافته است.

نگرانی در مورد تجزیه و تحلیل داده های بزرگ بسیار معتبر از نظر حفظ حریم خصوصی است. اجازه بدهید یک مثال بسیار ساده می دهد. امروزه من بسیار مطمئن است که بسیاری از ما استفاده از رسانه های اجتماعی مانند صورت کتاب توییتر و بسیاری از انجمن های اجتماعی دیگر و بسیاری از ما به تماشای فیلم در یوتیوب. این وب سایت با استفاده از ابزار تحلیلی داده های بزرگ برای شناسایی فعالیت های خود را در اینترنت دو داده های تجزیه و تحلیل رفتار جستجو و محتوای شما تماشا در رسانه های اجتماعی را تصور کنید. از طریق داده های بزرگ فعالیت خود را در انجمن اجتماعی رسانه ها به وضوح مشخص می تواند. این نقض آشکار حریم خصوصی است. علاوه بر این، فقط تصور کنید سازمان اشتراک گذاری داده ها از تحليل به چند آژانس های بازاریابی، این به نوبه خود مسائل مربوط به حریم خصوصی بیشتر ایجاد می کند.

حالا ما بحث چیزهایی از دیدگاه حفاظت از داده ها. به طور معمول. اطلاعات بزرگ در محیط ابر ذخیره می شود. یعنی داده ها بر روی شبکه توزیع و جایی در جهان ذخیره می شود. اجازه بدهید مثالی بزنم. ما در انگلستان اقامت و دسترسی به برخی از وب سایت رسانه های اجتماعی و اطلاعات خود را از جمله نمایه ممکن است ذخیره شده در یک کشور در آسیا و یا در برخی از کشور های دیگر می گویند. اگر وب سایت رسانه های اجتماعی به برخی از اطلاعات از جمله اطلاعات خود را به آژانس های بازاریابی فروش، آنها را در موقعیت برای دسترسی کامل به شما مشخصات از جمله شماره تلفن باشد.

اگر آژانس بازاریابی موقعیت جغرافیایی شماره تلفن آهنگ، آنها را در موقعیت ضبط خود را حق کامل جنبش از زمان ترک خانه خود و هنگامی که شما ترک خانه خود را برای کار و حتی سفر خود را به معشوق خود را به خانه دوست شما در حرکت باشد همچنین ثبت خواهد شد. مسلح با این اطلاعات، تبلیغات ممکن است چیزهایی را برای نفع خود را طبق روال منظم اتخاذ شده توسط شما هر روز استفاده کنید و آنها نیز می توانید پیدا کردن و ترویج سرمایه گذاری خود را به هر جا که هستید. به وضوح نشان می دهد که حفاظت از داده ها یکی دیگر از نگرانی های عمده با تجزیه و تحلیل داده های بزرگ است.

نگرانی خود را در مورد تجزیه و تحلیل داده های بزرگ به چند قانونگذاران و برگزار کنندگان سراسر جهان انگشت گذاشته اند. سازمان هایی مانند مصرف کننده ناظر را نیز مطرح دغدغه درباره حریم خصوصی و حفاظت از داده ها با تجزیه و تحلیل داده ها بزرگ. بر اساس گزارش از Gartner، “یک چهل درصد از مصرف کنندگان می گویند آنها می شود نگران به حریم خصوصی اگر آنها را به استفاده از سرویس های مکان تلفن همراه به طوری که آنها می تواند بیشتر هدفمند پیشنهادات از طریق برنامه های تبلیغاتی و یا وفاداری دریافت شد ‘.

داده های بزرگ ابزار بزرگ است و آن راه بیشتر و فرصت های زیادی برای سازمان های باز. مزایای فوق العاده ای داده های بزرگ نمی توسط نگرانی های خود را بیش از حفظ حریم خصوصی و حفاظت از داده ها دستکاری باید باشد. جنبه های خوب، بسیاری از سازمان ها از قبل به وضوح آگاه هستند و اطلاعات مربوط به این موضوع. برخی از سازمان ها برای به اشتراک گذاشتن قصد جمع آوری داده ها به مشتریان آغاز شده است. برخی از سازمان ها به روز سیاست حفظ حریم خصوصی را در وب سایت خود را به قصد آن استراتژی مجموعه داده ها را به اشتراک بگذارید.

علاوه بر ابر امنیت اتحاد (CSA)، کنسرسیوم فن آوری شرکت ها و سازمان های بخش دولتی راه اندازی بزرگ داده کار گروه، که برای پیدا کردن راه حل مناسب برای داده های محور در حال کار و مشکلات حفظ حریم خصوصی. بنابراین، امیدوارم، این دو موضوع عمده خطاب خواهد شد و مزایای تجزیه و تحلیل داده های بزرگ برای استفاده بزرگ و پتانسیل عظیم آن را ارائه می دهد را در روزهای آینده مهار قرار داده است. بیایید امیدواریم که برای بهترین.

android

با توجه به آی بی ام بالا، ما ایجاد 2.5 quintillion کلمه در ادامه متن از داده ها در هر روز. سرچشمه این داده ها از همه حوزه های فعالیت و در همه جا: به نام تنها چند داده از سنسور و سایت های رسانه های اجتماعی و تصاویر دیجیتال و وب لاگ و معامله رکورد خرید آنلاین و غیره، آمده است.

به طور کلی داده را می توان به سه دسته طبقه بندی است. هر گونه اطلاعات است که می تواند در پایگاه داده های ذخیره شده را می توان به عنوان داده های ساخت یافته نامیده می شود. به عنوان مثال، معامله رکورد خرید آنلاین را می توان در پایگاه داده ذخیره شده است. از این رو، آن به عنوان داده های ساخت یافته نامیده می شود. برخی از داده ها تا حدی می تواند در پایگاه داده است که می تواند به عنوان داده های نیمه ساخت یافته نام ذخیره می شوند. به عنوان مثال، اطلاعات در پرونده XML تا حدی می تواند در پایگاه داده ذخیره می شود و می توانید آن را به عنوان داده های نیمه ساخت یافته نام.

اشکال دیگر داده است که به این دو دسته متناسب خواهد شد به عنوان داده های بدون ساختار نامیده می شوند. به نام چند، اطلاعات از سایت های رسانه های اجتماعی، وب لاگ تجزیه و فرآوری شده در پایگاه داده ذخیره می شود نمی باشد، بنابراین آن را به عنوان داده های بدون ساختار طبقه بندی است. اصطلاح دیگر مورد استفاده برای داده های بدون ساختار داده های بزرگ است.

با توجه به NASSCOM، داده های ساخت یافته حساب برای 10 درصد از داده ها است که امروز در اینترنت وجود دارد. این حساب 10 ٪ از داده های نیمه ساخت یافته و 80 درصد باقی مانده از داده ها در داده های بدون ساختار می آید. به طور کلی سازمان های استفاده از تجزیه و تحلیل ساخت یافته و نیمه ساخت یافته داده ها با استفاده از ابزارهای تجزیه و تحلیل داده های سنتی. هیچ ابزار پیچیده به تجزیه و تحلیل داده های بدون ساختار تا چارچوب نقشه را کاهش می دهد که توسعه یافته توسط گوگل وجود دارد. بعد، آپاچی، توسعه چارچوب نام “Hadoop” است که تجزیه و تحلیل این داده ها و اطلاعات است که کمک بزرگی برای کسب و کار تصمیم گیری بهتر را نشان می دهد.

Hadoop در حال حاضر اهمیت آن در مناطق مختلف ثابت شده است. به عنوان مثال، با توجه به NASSCOM، بسیاری از سازمان ها با استفاده از آنالیز داده های بزرگ آغاز شده است. ملی اقیانوسی و فضای اداری (NOAA)، شرکت های ملی هوانوردی و فضایی (NASA) و چند دارویی و انرژی شروع کرده اند با استفاده از آنالیز داده های بزرگ گسترده برای پیش بینی رفتار مشتریان خود را.

با توجه به تحقیقات اخیر از گروه Nemertes سازمان ارزش در تجزیه و تحلیل داده های بزرگ و برنامه ریزی به اهرم بهتر در دلیل بیم و مزایای تجزیه و تحلیل داده ها بزرگ. نیویورک تایمز با استفاده از داده های بزرگ ابزار برای تجزیه و تحلیل متن و شرکت والت دیزنی استفاده از آنها را به/با مرتبط و رفتار مشتری در همه فروشگاه ها و پارک آن را درک. شرکت های هندی آن مانند TCS Wipro Infosys و دیگر بازیکنان کلیدی نیز شروع به درو پتانسیل بسیار ممتازی برخوردار است که داده های بزرگ همچنان به ارائه.

این به وضوح نشان می دهد که داده های بزرگ منطقه ای نوظهور است و بسیاری از شرکت ها برای کشف فرصت های جدید را شروع کرده اند. در همین حال، استفاده از داده های بزرگ اثبات می شود ارزشمند است اما در همان زمان نیز ممکن است اشاره کرد که حفاظت از حریم خصوصی و داده ها نگرانی های خود را نیز افزایش یافته است.

نگرانی در مورد تجزیه و تحلیل داده های بزرگ بسیار معتبر از نظر حفظ حریم خصوصی است. اجازه بدهید یک مثال بسیار ساده می دهد. امروزه من بسیار مطمئن است که بسیاری از ما استفاده از رسانه های اجتماعی مانند صورت کتاب توییتر و بسیاری از انجمن های اجتماعی دیگر و بسیاری از ما به تماشای فیلم در یوتیوب. این وب سایت با استفاده از ابزار تحلیلی داده های بزرگ برای شناسایی فعالیت های خود را در اینترنت دو داده های تجزیه و تحلیل رفتار جستجو و محتوای شما تماشا در رسانه های اجتماعی را تصور کنید. از طریق داده های بزرگ فعالیت خود را در انجمن اجتماعی رسانه ها به وضوح مشخص می تواند. این نقض آشکار حریم خصوصی است. علاوه بر این، فقط تصور کنید سازمان اشتراک گذاری داده ها از تحليل به چند آژانس های بازاریابی، این به نوبه خود مسائل مربوط به حریم خصوصی بیشتر ایجاد می کند.

حالا ما بحث چیزهایی از دیدگاه حفاظت از داده ها. به طور معمول. اطلاعات بزرگ در محیط ابر ذخیره می شود. یعنی داده ها بر روی شبکه توزیع و جایی در جهان ذخیره می شود. اجازه بدهید مثالی بزنم. ما در انگلستان اقامت و دسترسی به برخی از وب سایت رسانه های اجتماعی و اطلاعات خود را از جمله نمایه ممکن است ذخیره شده در یک کشور در آسیا و یا در برخی از کشور های دیگر می گویند. اگر وب سایت رسانه های اجتماعی به برخی از اطلاعات از جمله اطلاعات خود را به آژانس های بازاریابی فروش، آنها را در موقعیت برای دسترسی کامل به شما مشخصات از جمله شماره تلفن باشد.

اگر آژانس بازاریابی موقعیت جغرافیایی شماره تلفن آهنگ، آنها را در موقعیت ضبط خود را حق کامل جنبش از زمان ترک خانه خود و هنگامی که شما ترک خانه خود را برای کار و حتی سفر خود را به معشوق خود را به خانه دوست شما در حرکت باشد همچنین ثبت خواهد شد. مسلح با این اطلاعات، تبلیغات ممکن است چیزهایی را برای نفع خود را طبق روال منظم اتخاذ شده توسط شما هر روز استفاده کنید و آنها نیز می توانید پیدا کردن و ترویج سرمایه گذاری خود را به هر جا که هستید. به وضوح نشان می دهد که حفاظت از داده ها یکی دیگر از نگرانی های عمده با تجزیه و تحلیل داده های بزرگ است.

نگرانی خود را در مورد تجزیه و تحلیل داده های بزرگ به چند قانونگذاران و برگزار کنندگان سراسر جهان انگشت گذاشته اند. سازمان هایی مانند مصرف کننده ناظر را نیز مطرح دغدغه درباره حریم خصوصی و حفاظت از داده ها با تجزیه و تحلیل داده ها بزرگ. بر اساس گزارش از Gartner، “یک چهل درصد از مصرف کنندگان می گویند آنها می شود نگران به حریم خصوصی اگر آنها را به استفاده از سرویس های مکان تلفن همراه به طوری که آنها می تواند بیشتر هدفمند پیشنهادات از طریق برنامه های تبلیغاتی و یا وفاداری دریافت شد ‘.

داده های بزرگ ابزار بزرگ است و آن راه بیشتر و فرصت های زیادی برای سازمان های باز. مزایای فوق العاده ای داده های بزرگ نمی توسط نگرانی های خود را بیش از حفظ حریم خصوصی و حفاظت از داده ها دستکاری باید باشد. جنبه های خوب، بسیاری از سازمان ها از قبل به وضوح آگاه هستند و اطلاعات مربوط به این موضوع. برخی از سازمان ها برای به اشتراک گذاشتن قصد جمع آوری داده ها به مشتریان آغاز شده است. برخی از سازمان ها به روز سیاست حفظ حریم خصوصی را در وب سایت خود را به قصد آن استراتژی مجموعه داده ها را به اشتراک بگذارید.

علاوه بر ابر امنیت اتحاد (CSA)، کنسرسیوم فن آوری شرکت ها و سازمان های بخش دولتی راه اندازی بزرگ داده کار گروه، که برای پیدا کردن راه حل مناسب برای داده های محور در حال کار و مشکلات حفظ حریم خصوصی. بنابراین، امیدوارم، این دو موضوع عمده خطاب خواهد شد و مزایای تجزیه و تحلیل داده های بزرگ برای استفاده بزرگ و پتانسیل عظیم آن را ارائه می دهد را در روزهای آینده مهار قرار داده است. بیایید امیدواریم که برای بهترین.

یک راه برای به اشتراک گذاشتن داده های رمزگذاری شده وجود دارد و فقط اجازه رمزگشایی و جلوگیری از رمزگذاری مجدد وجود دارد

این مورد است که من نیاز به به اشتراک گذاشتن داده ها رمزگذاری شده با مشتریان اجازه می دهد آنها را فقط رمزگشایی آن

ایده کم است ما مجاز به نگه داشتن یک نسخه از این داده های مشترک
در حالی که مشتری باید به

باشد، بنابراین ما نیاز داریم که هر زمان یا در صورت اختلاف، ما به داده های رمزگذاری شده اصلی بازگردانده شده و طرف مشتری با تضمین یکپارچگی آن

بازگردانیم، یک علامت فایل اضافه خواهیم کرد، اما ما نیاز به داده های اصلی به اشتراک گذاشته ایم همچنین

برنامه وب – چرا درخواست های POST متقابل دامنه اجازه داده می شود؟

من درک می کنم که بهترین روش استفاده از نشانه ها برای جلوگیری از CSRF است، اما چرا مرورگرها به جای درخواست POST متقابل سایت اجازه می دهند؟ به نظر می رسد که دادن احزاب غیر قابل اعتماد امکان دسترسی نوشتاری به سرور شما یک ایده بد است.

سایت W3 می گوید: "تحت یک سیاست مبدا، ارسال اطلاعات متقابل سایت نیز خطرناک است زیرا حملات مانند متقابل، جعل تقلب در سایت (CSRF) و clickjacking. خط مشی همان مبدا نمی تواند این آسیب پذیری های امنیتی را به همان شیوه ای که در اطراف دریافت اطالعات قرار دارد، رد کند چرا که ممنوعیت ارسال متقابل سایت از طریق لینک های متقابل سایت ممنوع است. " [1]

اما این به نظر می رسد مثل دوگانگی دروغین است. ما می توانیم POST های متقارن را مجاز کنیم در حالی که هنوز هم اجازه می دهیم لینک هایی که GET دریافت می کنند.

[1] https://www.w3.org/Security/wiki/Same_Origin_Policy