Deck 10: Big Data Technologies
سؤال
سؤال
سؤال
سؤال
سؤال
سؤال
سؤال
سؤال
سؤال
سؤال
سؤال
سؤال
سؤال
سؤال
سؤال
سؤال
سؤال
سؤال
سؤال
سؤال
سؤال
سؤال
سؤال
سؤال
سؤال
سؤال
سؤال
سؤال
سؤال
سؤال
سؤال
سؤال
سؤال
سؤال
سؤال
سؤال
سؤال
سؤال
سؤال
سؤال
سؤال
سؤال
سؤال
سؤال
سؤال
سؤال
سؤال
سؤال
سؤال
سؤال
سؤال
سؤال
سؤال
سؤال
سؤال
سؤال
سؤال
سؤال
سؤال
سؤال
سؤال
سؤال
سؤال
سؤال
سؤال
سؤال
سؤال
سؤال
سؤال
فتح الحزمة
قم بالتسجيل لفتح البطاقات في هذه المجموعة!
Unlock Deck
Unlock Deck
1/69
العب
ملء الشاشة (f)
Deck 10: Big Data Technologies
1
Data in MongoDB is represented in:
A) JSON.
B) BSON.
C) CSON.
D) SON.
A) JSON.
B) BSON.
C) CSON.
D) SON.
B
2
Apache Cassandra is a leading producer of ________ NoSQL database management systems.
A) key-value store
B) wide-column
C) relational
D) graph
A) key-value store
B) wide-column
C) relational
D) graph
B
3
Big data:
A) requires a normalized dataset to 3rd Normal Form.
B) does not require a strictly defined data model.
C) requires a strictly defined schema.
D) requires a normalized dataset to BCNF.
A) requires a normalized dataset to 3rd Normal Form.
B) does not require a strictly defined data model.
C) requires a strictly defined schema.
D) requires a normalized dataset to BCNF.
B
4
MongoDB databases are composed of:
A) collections.
B) tables.
C) rowsets.
D) columns.
A) collections.
B) tables.
C) rowsets.
D) columns.
فتح الحزمة
افتح القفل للوصول البطاقات البالغ عددها 69 في هذه المجموعة.
فتح الحزمة
k this deck
5
An organization that requires a sole focus on performance with the ability for keys to include strings, hashes, lists, and sorted sets would select ________ database management system.
A) Access
B) Excel Spreadsheet
C) Neo4j
D) Redis
A) Access
B) Excel Spreadsheet
C) Neo4j
D) Redis
فتح الحزمة
افتح القفل للوصول البطاقات البالغ عددها 69 في هذه المجموعة.
فتح الحزمة
k this deck
6
Big data includes:
A) large volumes of data with many different data types that are processed at very high speeds.
B) large volumes of data entry with a single data type processed at very high speeds.
C) large volumes of entity relationship diagrams (ERD) with many different data types that are processed at very high speeds.
D) large volumes of entity relationship diagrams (ERD) with a single data type processed at very high speeds.
A) large volumes of data with many different data types that are processed at very high speeds.
B) large volumes of data entry with a single data type processed at very high speeds.
C) large volumes of entity relationship diagrams (ERD) with many different data types that are processed at very high speeds.
D) large volumes of entity relationship diagrams (ERD) with a single data type processed at very high speeds.
فتح الحزمة
افتح القفل للوصول البطاقات البالغ عددها 69 في هذه المجموعة.
فتح الحزمة
k this deck
7
At a basic level, analytics refers to:
A) collecting data.
B) conducting a needs analysis.
C) analysis and interpretation of data.
D) normalizing data.
A) collecting data.
B) conducting a needs analysis.
C) analysis and interpretation of data.
D) normalizing data.
فتح الحزمة
افتح القفل للوصول البطاقات البالغ عددها 69 في هذه المجموعة.
فتح الحزمة
k this deck
8
The NoSQL model that incorporates 'column families' is called a:
A) key-value store.
B) document store.
C) wide-column store.
D) column-SQL database.
A) key-value store.
B) document store.
C) wide-column store.
D) column-SQL database.
فتح الحزمة
افتح القفل للوصول البطاقات البالغ عددها 69 في هذه المجموعة.
فتح الحزمة
k this deck
9
________ generally processes the largest quantities of data.
A) Operational databases
B) Transaction processing
C) Big data
D) Data marts
A) Operational databases
B) Transaction processing
C) Big data
D) Data marts
فتح الحزمة
افتح القفل للوصول البطاقات البالغ عددها 69 في هذه المجموعة.
فتح الحزمة
k this deck
10
NoSQL systems allow ________ by incorporating commodity servers that can be easily added to the architectural solution.
A) scaling down
B) scaling out
C) scaling up
D) scaling over
A) scaling down
B) scaling out
C) scaling up
D) scaling over
فتح الحزمة
افتح القفل للوصول البطاقات البالغ عددها 69 في هذه المجموعة.
فتح الحزمة
k this deck
11
An organization that decides to adopt the most popular NoSQL database management system would select:
A) Access.
B) MongoDB.
C) Neo4j.
D) Redis.
A) Access.
B) MongoDB.
C) Neo4j.
D) Redis.
فتح الحزمة
افتح القفل للوصول البطاقات البالغ عددها 69 في هذه المجموعة.
فتح الحزمة
k this deck
12
The NoSQL model that is specifically designed to maintain information regarding the relationships (often real-world instances of entities) between data items is called a:
A) key-value store.
B) document store.
C) wide-column store.
D) graph-oriented database.
A) key-value store.
B) document store.
C) wide-column store.
D) graph-oriented database.
فتح الحزمة
افتح القفل للوصول البطاقات البالغ عددها 69 في هذه المجموعة.
فتح الحزمة
k this deck
13
An organization that requires a graph database that is highly scalable would select the ________ database management system.
A) Access
B) Excel Spreadsheet
C) Neo4j
D) Redis
A) Access
B) Excel Spreadsheet
C) Neo4j
D) Redis
فتح الحزمة
افتح القفل للوصول البطاقات البالغ عددها 69 في هذه المجموعة.
فتح الحزمة
k this deck
14
NoSQL focuses on:
A) avoidance of replication of data.
B) minimizing storage space.
C) normalized data.
D) flexibility.
A) avoidance of replication of data.
B) minimizing storage space.
C) normalized data.
D) flexibility.
فتح الحزمة
افتح القفل للوصول البطاقات البالغ عددها 69 في هذه المجموعة.
فتح الحزمة
k this deck
15
According to your text, NoSQL stands for:
A) Numbered SQL.
B) No SQL.
C) Not Only SQL.
D) Numeric Only SQL.
A) Numbered SQL.
B) No SQL.
C) Not Only SQL.
D) Numeric Only SQL.
فتح الحزمة
افتح القفل للوصول البطاقات البالغ عددها 69 في هذه المجموعة.
فتح الحزمة
k this deck
16
________ is the most popular key-value store NoSQL database management system.
A) Access
B) Apache Cassandra
C) Neo4j
D) Redis
A) Access
B) Apache Cassandra
C) Neo4j
D) Redis
فتح الحزمة
افتح القفل للوصول البطاقات البالغ عددها 69 في هذه المجموعة.
فتح الحزمة
k this deck
17
The three 'v's' commonly associated with big data include:
A) viewable, volume, and variety.
B) volume, variety, and velocity.
C) verified, variety, and velocity.
D) vigilant, viewable, and verified.
A) viewable, volume, and variety.
B) volume, variety, and velocity.
C) verified, variety, and velocity.
D) vigilant, viewable, and verified.
فتح الحزمة
افتح القفل للوصول البطاقات البالغ عددها 69 في هذه المجموعة.
فتح الحزمة
k this deck
18
The NoSQL model that includes a simple pair of a key and an associated collection of values is called a:
A) key-value store.
B) document store.
C) wide-column store.
D) graph database.
A) key-value store.
B) document store.
C) wide-column store.
D) graph database.
فتح الحزمة
افتح القفل للوصول البطاقات البالغ عددها 69 في هذه المجموعة.
فتح الحزمة
k this deck
19
NoSQL includes data storage and retrieval:
A) based on the relational model.
B) based on normalized tables.
C) not based on the relational model.
D) not based on data.
A) based on the relational model.
B) based on normalized tables.
C) not based on the relational model.
D) not based on data.
فتح الحزمة
افتح القفل للوصول البطاقات البالغ عددها 69 في هذه المجموعة.
فتح الحزمة
k this deck
20
Big data requires effectively processing:
A) a single data type (numeric).
B) two data types (text and numeric).
C) many data types.
D) a single data type (text).
A) a single data type (numeric).
B) two data types (text and numeric).
C) many data types.
D) a single data type (text).
فتح الحزمة
افتح القفل للوصول البطاقات البالغ عددها 69 في هذه المجموعة.
فتح الحزمة
k this deck
21
Value (related to the five 'v's' of big data) addresses the pursuit of a meaningful goal.
فتح الحزمة
افتح القفل للوصول البطاقات البالغ عددها 69 في هذه المجموعة.
فتح الحزمة
k this deck
22
With HDFS it is less expensive to move the execution of computation to data than to move the:
A) data to hardware.
B) data to systems analysis.
C) data to computation.
D) data to processes.
A) data to hardware.
B) data to systems analysis.
C) data to computation.
D) data to processes.
فتح الحزمة
افتح القفل للوصول البطاقات البالغ عددها 69 في هذه المجموعة.
فتح الحزمة
k this deck
23
________ includes concern about data quality issues.
A) Velocity
B) Vigilant
C) Veracity
D) Variety
A) Velocity
B) Vigilant
C) Veracity
D) Variety
فتح الحزمة
افتح القفل للوصول البطاقات البالغ عددها 69 في هذه المجموعة.
فتح الحزمة
k this deck
24
________ includes the value of speed in a NoSQL database.
A) Velocity
B) Vigilant
C) Verified
D) Variety
A) Velocity
B) Vigilant
C) Verified
D) Variety
فتح الحزمة
افتح القفل للوصول البطاقات البالغ عددها 69 في هذه المجموعة.
فتح الحزمة
k this deck
25
It is true that in an HDFS cluster the NameNode is the:
A) large number of slaves.
B) single master server.
C) language library.
D) business intelligence.
A) large number of slaves.
B) single master server.
C) language library.
D) business intelligence.
فتح الحزمة
افتح القفل للوصول البطاقات البالغ عددها 69 في هذه المجموعة.
فتح الحزمة
k this deck
26
Big data allows for two different data types (text and numeric).
فتح الحزمة
افتح القفل للوصول البطاقات البالغ عددها 69 في هذه المجموعة.
فتح الحزمة
k this deck
27
Although volume, variety, and velocity are considered the initial three v dimensions, two additional Vs of big data were added and include:
A) veracity and verified.
B) volume and verified.
C) verified and valuable.
D) veracity and value.
A) veracity and verified.
B) volume and verified.
C) verified and valuable.
D) veracity and value.
فتح الحزمة
افتح القفل للوصول البطاقات البالغ عددها 69 في هذه المجموعة.
فتح الحزمة
k this deck
28
NoSQL systems enable automated ________ to allow distribution of the data among multiple nodes to allow servers to operate independently on the data located on it.
A) sharing
B) sharding
C) SQL
D) mongo
A) sharing
B) sharding
C) SQL
D) mongo
فتح الحزمة
افتح القفل للوصول البطاقات البالغ عددها 69 في هذه المجموعة.
فتح الحزمة
k this deck
29
The Hadoop Distributed File System (HDFS) is the foundation of a ________ infrastructure of Hadoop.
A) relational database management system
B) DBBMS
C) Java
D) data management
A) relational database management system
B) DBBMS
C) Java
D) data management
فتح الحزمة
افتح القفل للوصول البطاقات البالغ عددها 69 في هذه المجموعة.
فتح الحزمة
k this deck
30
The primary use of Pig is to:
A) transform raw data into a format that is useful for analysis.
B) query large databases.
C) create large databases.
D) create data warehouses.
A) transform raw data into a format that is useful for analysis.
B) query large databases.
C) create large databases.
D) create data warehouses.
فتح الحزمة
افتح القفل للوصول البطاقات البالغ عددها 69 في هذه المجموعة.
فتح الحزمة
k this deck
31
It is true that in an HDFS cluster the DataNodes are the:
A) large number of slaves.
B) single master servers.
C) language libraries.
D) business intelligences.
A) large number of slaves.
B) single master servers.
C) language libraries.
D) business intelligences.
فتح الحزمة
افتح القفل للوصول البطاقات البالغ عددها 69 في هذه المجموعة.
فتح الحزمة
k this deck
32
When reporting and analysis organization of the data is determined when the data is used is called a(n):
A) entity relationship diagram.
B) schema binding.
C) schema on read.
D) cognitive schema.
A) entity relationship diagram.
B) schema binding.
C) schema on read.
D) cognitive schema.
فتح الحزمة
افتح القفل للوصول البطاقات البالغ عددها 69 في هذه المجموعة.
فتح الحزمة
k this deck
33
The original three 'v's' attributed to big data include volume, variety, and velocity.
فتح الحزمة
افتح القفل للوصول البطاقات البالغ عددها 69 في هذه المجموعة.
فتح الحزمة
k this deck
34
Hive uses ________ to query data.
A) SQL
B) HiveQL
C) BeesNest
D) Honeyquery
A) SQL
B) HiveQL
C) BeesNest
D) Honeyquery
فتح الحزمة
افتح القفل للوصول البطاقات البالغ عددها 69 في هذه المجموعة.
فتح الحزمة
k this deck
35
________ includes NoSQL accommodation of various data types.
A) Velocity
B) Vigilant
C) Verified
D) Variety
A) Velocity
B) Vigilant
C) Verified
D) Variety
فتح الحزمة
افتح القفل للوصول البطاقات البالغ عددها 69 في هذه المجموعة.
فتح الحزمة
k this deck
36
When a data repository (including internal and external data) does NOT follow a predefined schema, this is called a:
A) data dump.
B) data ocean.
C) data lake.
D) data stream.
A) data dump.
B) data ocean.
C) data lake.
D) data stream.
فتح الحزمة
افتح القفل للوصول البطاقات البالغ عددها 69 في هذه المجموعة.
فتح الحزمة
k this deck
37
An organization using HDFS realizes that hardware failure is a(n):
A) norm.
B) irregularity.
C) anomaly.
D) inconsistency.
A) norm.
B) irregularity.
C) anomaly.
D) inconsistency.
فتح الحزمة
افتح القفل للوصول البطاقات البالغ عددها 69 في هذه المجموعة.
فتح الحزمة
k this deck
38
The Hadoop framework consists of the ________ algorithm to solve large scale problems.
A) MapSystem
B) MapReduce
C) MapCluster
D) MapComponent
A) MapSystem
B) MapReduce
C) MapCluster
D) MapComponent
فتح الحزمة
افتح القفل للوصول البطاقات البالغ عددها 69 في هذه المجموعة.
فتح الحزمة
k this deck
39
________ is an important scripting language to help reduce the complexity of MapReduce.
A) Pig
B) Horse
C) Dog
D) Cat
A) Pig
B) Horse
C) Dog
D) Cat
فتح الحزمة
افتح القفل للوصول البطاقات البالغ عددها 69 في هذه المجموعة.
فتح الحزمة
k this deck
40
Hive is a(n) ________ data warehouse software.
A) Oracle
B) Microsoft
C) Macintosh
D) Apache
A) Oracle
B) Microsoft
C) Macintosh
D) Apache
فتح الحزمة
افتح القفل للوصول البطاقات البالغ عددها 69 في هذه المجموعة.
فتح الحزمة
k this deck
41
NoSQL databases DO NOT support ACID (atomicity, consistency, isolation, and durability).
فتح الحزمة
افتح القفل للوصول البطاقات البالغ عددها 69 في هذه المجموعة.
فتح الحزمة
k this deck
42
Graph-oriented databases are designed to maintain information regarding the relationships between data items.
فتح الحزمة
افتح القفل للوصول البطاقات البالغ عددها 69 في هذه المجموعة.
فتح الحزمة
k this deck
43
Word processing documents are commonly stored in a 'document store' NoSQL database model.
فتح الحزمة
افتح القفل للوصول البطاقات البالغ عددها 69 في هذه المجموعة.
فتح الحزمة
k this deck
44
The target market for Hadoop is small to medium companies using local area networks.
فتح الحزمة
افتح القفل للوصول البطاقات البالغ عددها 69 في هذه المجموعة.
فتح الحزمة
k this deck
45
Economies of storage indicate data storage costs increase every year.
فتح الحزمة
افتح القفل للوصول البطاقات البالغ عددها 69 في هذه المجموعة.
فتح الحزمة
k this deck
46
MapReduce is an algorithm for massive parallel processing utilized by Hadoop.
فتح الحزمة
افتح القفل للوصول البطاقات البالغ عددها 69 في هذه المجموعة.
فتح الحزمة
k this deck
47
Structured Query Language (SQL) is a set of methodologies, processes, architectures, and technologies that transform raw data into meaningful information.
فتح الحزمة
افتح القفل للوصول البطاقات البالغ عددها 69 في هذه المجموعة.
فتح الحزمة
k this deck
48
HBASE is a wide-column store database that runs on top of HDFS (modeled after Google).
فتح الحزمة
افتح القفل للوصول البطاقات البالغ عددها 69 في هذه المجموعة.
فتح الحزمة
k this deck
49
Neo4j is a wide-column NoSQL database management system developed by Oracle.
فتح الحزمة
افتح القفل للوصول البطاقات البالغ عددها 69 في هذه المجموعة.
فتح الحزمة
k this deck
50
The dive in anywhere characteristic of a data lake overrides constraints related to confidentiality.
فتح الحزمة
افتح القفل للوصول البطاقات البالغ عددها 69 في هذه المجموعة.
فتح الحزمة
k this deck
51
The 'schema on read' approach often incorporates JSON or XML.
فتح الحزمة
افتح القفل للوصول البطاقات البالغ عددها 69 في هذه المجموعة.
فتح الحزمة
k this deck
52
NoSQL focuses on avoidance of replication and minimizing storage space.
فتح الحزمة
افتح القفل للوصول البطاقات البالغ عددها 69 في هذه المجموعة.
فتح الحزمة
k this deck
53
Transaction processing and management reporting tend to fit big data databases better than relational databases.
فتح الحزمة
افتح القفل للوصول البطاقات البالغ عددها 69 في هذه المجموعة.
فتح الحزمة
k this deck
54
Collect everything is a characteristic of a data lake.
فتح الحزمة
افتح القفل للوصول البطاقات البالغ عددها 69 في هذه المجموعة.
فتح الحزمة
k this deck
55
MongoDB is a proprietary NoSQL database management system created by Oracle.
فتح الحزمة
افتح القفل للوصول البطاقات البالغ عددها 69 في هذه المجموعة.
فتح الحزمة
k this deck
56
NoSQL stands for 'Not only SQL.'
فتح الحزمة
افتح القفل للوصول البطاقات البالغ عددها 69 في هذه المجموعة.
فتح الحزمة
k this deck
57
HP HAVEn integrates HP technologies with open source big data technologies.
فتح الحزمة
افتح القفل للوصول البطاقات البالغ عددها 69 في هذه المجموعة.
فتح الحزمة
k this deck
58
Apache Cassandra is a wide-column NoSQL database management system.
فتح الحزمة
افتح القفل للوصول البطاقات البالغ عددها 69 في هذه المجموعة.
فتح الحزمة
k this deck
59
A business owner that needs carefully normalized tables would likely need a relational database instead of a NoSQL database.
فتح الحزمة
افتح القفل للوصول البطاقات البالغ عددها 69 في هذه المجموعة.
فتح الحزمة
k this deck
60
JSON is commonly used in conjunction with the 'document store' NoSQL database model.
فتح الحزمة
افتح القفل للوصول البطاقات البالغ عددها 69 في هذه المجموعة.
فتح الحزمة
k this deck
61
There are four main types of NoSQL database data models that include key-value stores, document stores, wide-column stores, and graph databases. Provide an example of a NoSQL database management system for each model.
فتح الحزمة
افتح القفل للوصول البطاقات البالغ عددها 69 في هذه المجموعة.
فتح الحزمة
k this deck
62
The schema on write and schema on read are considered synonymous approaches.
فتح الحزمة
افتح القفل للوصول البطاقات البالغ عددها 69 في هذه المجموعة.
فتح الحزمة
k this deck
63
Server logs are considered a big data variety data type.
فتح الحزمة
افتح القفل للوصول البطاقات البالغ عددها 69 في هذه المجموعة.
فتح الحزمة
k this deck
64
The philosophical underpinnings of big data are based on schema on write.
فتح الحزمة
افتح القفل للوصول البطاقات البالغ عددها 69 في هذه المجموعة.
فتح الحزمة
k this deck
65
Describe the Five Vs of Big Data.
فتح الحزمة
افتح القفل للوصول البطاقات البالغ عددها 69 في هذه المجموعة.
فتح الحزمة
k this deck
66
Hive creates MapReduce jobs and executes them on a Hadoop Cluster.
فتح الحزمة
افتح القفل للوصول البطاقات البالغ عددها 69 في هذه المجموعة.
فتح الحزمة
k this deck
67
There are four main types of NoSQL database data models that include key-value stores, document stores, wide-column stores, and graph databases. Provide a brief description of each.
فتح الحزمة
افتح القفل للوصول البطاقات البالغ عددها 69 في هذه المجموعة.
فتح الحزمة
k this deck
68
Big data databases tend to sacrifice consistency for availability.
فتح الحزمة
افتح القفل للوصول البطاقات البالغ عددها 69 في هذه المجموعة.
فتح الحزمة
k this deck
69
Describe conceptually how big data differs from traditional relational database management systems.
فتح الحزمة
افتح القفل للوصول البطاقات البالغ عددها 69 في هذه المجموعة.
فتح الحزمة
k this deck